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OM nucleic - nucleic search, using sw model 



Run on: 



February 28, 2004, 03:39:37 ; Search time 4277 Seconds 

(without alignments) 
12595.598 Million cell updates/ 



Title: 

Perfect score: 
Sequence : 



US-09-668-314C-1 
1804 

1 atgggcgcactggcccgggc 



aaaccaaaaaaaaaaaaaaa 1804 



Scoring table: IDENTITY_NUC 

Gapop 10 . 0 , Gapext 1 . 0 



Searched : 



27513289 seqs, 14931090276 residues 



Total number of hits satisfying chosen parameters: 

Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 



55026578 



Post -processing : 



Database 



Minimum Match 0% 
Maximum Match 100% 
Listing first 45 summaries 

EST: * 
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em_estba : * 

em_esthum: * 

em_estin : * 

em estmu: * 

em_estov: * 

em_estpl : * 

em_estro : * 

em__htc : * 

gbjestl : * 
gb_est2 : * 
gb_htc : * 
gb_est3 : * 
gb_est4 : * 
gb_est5 : * 
em_estfun: * 
em_estom: * 
em_gss_hum: * 
em_gss_inv: * 
em_gss_pln : * 
em_gss_vrt : * 
em_g s s_f un : * 
em gss mam: * 
em_gss_mus : * 
em_gss_pro : * 
em_gss_rod: * 
em_gss_phg: * 
em_gss_vrl : * 



28: gb_gssl:* 
29: gbjgss2:* 

Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 
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RESULT 1 
AK078770 
LOCUS 

DEFINITION 



ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 
MEDLINE 
PUBMED 

REFERENCE 
AUTHORS 

TITLE 

JOURNAL 
MEDLINE 
PUBMED 
REFERENCE 
AUTHORS 



TITLE 

JOURNAL 
MEDLINE 
PUBMED 
REFERENCE 
AUTHORS 

TITLE 
JOURNAL 
REFERENCE 
AUTHORS 

TITLE 

JOURNAL 
REFERENCE 



AK078770 3703 bp mRNA linear HTC 18-SEP-2003 

Mus musculus 15 days embryo male testis cDNA f RIKEN full-length 
enriched library, clone : 8030470009 product : beta- site APP-cleaving 
enzyme 2 , full insert sequence . 
AK078770 

AK078770 .1 GI : 26347470 
HTC; CAP trapper. 
Mus musculus (house mouse) 
Mus musculus 

Eukaryota; Metazoa; Chorda ta; Craniata; Vertebra ta; Euteleostomi ; 
Mammalia; Eutheria; Rodentia; Sciurognathi ; Muridae; Murinae; Mus. 
1 

Carninci , P . and Hayashi zaki , Y . 

High-efficiency full-length cDNA cloning 

Meth. Enzymol. 303, 19-44 (1999) 

99279253 

10349636 

2 

Carninci, P., Shibata,Y. , Hayatsu,N. , Sugahara,Y. , Shibata,K. , 

Itoh,M., Konno,H., Okazaki,Y., Muramatsu,M. and Hayashi zaki ,Y. 

Normalization and subtraction of cap- trapper- selected cDNAs to 

prepare full-length cDNA libraries for rapid discovery of new genes 

Genome Res. 10 (10), 1617-1630 (2000) 

20499374 

11042159 

3 

Shibata,K. , Itoh,M. , Aizawa,K. , Nagaoka,S., Sasaki, N. , Carninci, P. , 
Konno,H., Akiyama,J. , Nishi,K., Kitsunai,T., Tashiro,H. , Itoh,M. , 
Sumi,N., Ishii,Y., Nakamura,S., Hazama,M. , Nishine,T. , Harada,A. , 
Yamamoto,R. , Matsumoto,H. , Sakaguchi,S. , Ikegami,T., Kashiwagi , K . , 
Fujiwake,S. , Inoue,K. , Togawa,Y. , Izawa,M. f Ohara,E. , Watahiki ,M. , 
Yoneda,Y. , Ishikawa,T. , Ozawa,K. , Tanaka,T. , Matsuura,S., Kawai,J., 
Okazaki,Y., Muramatsu,M. , Inoue,Y. , Kira,A. and Hayashi z aki ,Y . 
RIKEN integrated sequence analysis (RISA) system — 38 4 -format 
sequencing pipeline with 384 multi capillary sequencer 
Genome Res. 10 (11), 1757-1771 (2000) 
20530913 
11076861 
4 

The RIKEN Genome Exploration Research Group Phase II Team and the 
FANTOM Consortium. 

Functional annotation of a full-length mouse cDNA collection 

Nature 409, 685-690 (2001) 

5 

The FANTOM Consortium and the RIKEN Genome Exploration Research 
Group Phase I & II Team. 

Analysis of the mouse transcriptome based on functional annotation 
of 60,770 full-length cDNAs 
Nature 420, 563-573 (2002) 
6 (bases 1 to 3703) 



AUTHORS 



TITLE 
JOURNAL 



COMMENT 



FEATURES 

source 



CDS 



Adachi,J., Aizawa,K. , Akimura,T. , Arakawa,T. , Bono,H., Carninci,P., 
Fukuda,S. , Furuno,M. , Hanagaki,T. , Hara,A. , Hashizume , W. , 
Hayashida,K. , Hayatsu,N. , Hiramoto,K. , Hiraoka,T. , Hirozane,T., 
Hori,F., Imotani,K., Ishii,Y., Itoh,M. , Kagawa,I., Kasukawa,T. , 
Katoh,H. , Kawai,J., Kojima,Y. , Kondo,S., Konno,H. , Kouda,M. , 
Koya ,S,, Kurihara , C . , Ma tsuyama , T . , Miyazaki , A . , Mura ta ,M. , 
Nakamura r M. f Nishi,K., Nomura ; K. , Numazaki,R., Ohno,M. , Ohsato,N. , 
Okazaki,Y., Saito,R. , Saitoh, H. , Sakai,C, Sakai,K., Sakazume,N. , 
Sano,H., Sasaki, D. , Shibata,K. , Shinagawa,A. , Shiraki,T., 
Sogabe,Y. , Tagami,M. , Tagawa,A. , Takahashi,F. , Takaku-Akahira , S . , 
Takeda,Y., Tanaka,T. , Tomaru,A. , Toya,T. , Yasunishi , A. , 
Muramatsu^. and Hayashizaki , Y . 
Direct Submission 

Submitted (16-APR-2002) Yoshihide Hayashizaki, The Institute of 
Physical and Chemical Research (RIKEN) , Laboratory for Genome 
Exploration Research Group, RIKEN Genomic Sciences Center (GSC) , 
RIKEN Yokohama Institute; 1-7-22 Suehiro-cho, Tsurumi-ku, Yokohama, 
Kanagawa 230-0045, Japan (E-mail :genome-res@gsc. riken. go. jp, 
URL : http : //genome . gsc . riken . go . jp/ , Tel : 81-45-503-9222 , 
Fax: 81-45-503-9216) 

cDNA library was prepared and sequenced in Mouse Genome 
Encyclopedia Project of Genome Exploration Research Group in Riken 
Genomic Sciences Center and Genome Science Laboratory in RIKEN. 
Division of Experimental Animal Research in Riken contributed to 
prepare mouse tissues . 

Please visit our web site for further details. 
URL : http : //genome . gsc . riken . go . jp/ 
URL : http : //fan torn, gsc . riken . go . jp/ . 

Location/Qualifiers 

1. .3703 

/organism="Mus mus cuius" 

/mol_type= " mRNA" 

/ s train= " C57BL/ 6 J" 

/ db_xref = " FANTOM_DB : 8 0 3 0 4 7 0O0 9 " 

/db_xref="MGI: 2397 197" 

/db_xref =" taxon : 10090 " 

/clone=" 8030470009" 

/sex="male" 

/ 1 i s sue_type= " te s t i s " 

/clone_lib=" RIKEN full-length enriched mouse cDNA library" 
/dev_jstage="15 days embryo" 
42. .1586 

/note=" unnamed protein product; beta-site APP-cleaving 

enzyme 2 (MGD |MGI : 1860440 , GB |NM__0 19517 , evidence: BLASTN, 

99%, match=1774) 

putative" 

/codon_start=l 

/protein_id="BAC37384 . 1" 

/db_xref="GI: 26347471" 

/ trans 1 a t i on= " MGALLRALLLP VLAQWLLS AVPALAPAPFTLPLQVARATNHRAS 
AVPGLGTPGLPRADGLALALEPVRATANFLAMVDNLQGDSGRGYYLEMLIGTPPQKVQ 
I LVDTGS SNFAVAGAPHS YIDTYFDSES S STYHSKGFDVTVKYTQGS WTGFVGEDLVT 
I PKGFNS S FLVNI AT I FE SENFFLPGIKWNGI LGLAYAALAKP S S S LETFFD S L VAQA 
KIPDIFSMQMCGAGLPVAGSGTNGGSLVLGGIEPSLYKGDIWYTPIKEEWYYQIEILK 
LEI GGQNLNU)CREYNADKAI VDSGTTLLRLPQKVFDAVVEAVARTS LI PEFSDGFWT 
GAQLACWTNSETPWAY FPKI S I YLRDENASRS FRI TI LPQL Y I QPMMGAGFNYEC YRF 
GI S S S TNALVI GATVMEGFY WFDRAQRRVGFAVS PCAEIEGTTVSE I S GPFSTED I A 



ORIGIN 



SNCVPAQALNEPI LWIVSYALMSVCGAI LLVLILLLLLPLHCRHAPRDPEWNDESSL 
VRHRWK" 



Query Match 65.5%; Score 1182.2; DB 11; Length 3703; 

Best Local Similarity 80.6%; Pred. No. 1.6e-164; 

Matches 1447; Conservative 0; Mismatches 308; Indels 40; Gaps 



Qy 1 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 42 ATGGGCGCGCTGCTTCGAGCACTCTTGCTCCCGGTGCTGGCGCAGTGGCTCTTGAGTGCG 101 

Qy 61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 120 

I Ml | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I 

Db 102 GTCCCCGCGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCAAGTGGCCCGGGCCACGAAC 161 

Qy 121 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 180 

|| || Ml I I I I I I I I I I I II I I I I I I I I I I M I I II 

Db 162 CACAGAGCCTCGGCTGTTCCCGGACTCGGGACCCCCGGGTTGCCCCGGGCCGATGGTCTG 221 

Qy 181 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 240 

II Mill llllllllll I Ml I I I I I I I I M I I 

Db 222 GCCCTCGCACTGGAGCCTGTCAGGGC TACTGCCAACTTCTTGGCTATG 269 

Qy 241 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 300 

II | M I II I I II I I I I I II I I I I I I I I I I I I I I M M M I I I I I II II M M M M I 
Db 270 GTGGACAACCTTCAGGGGGACTCTGGCCGCGGCTACTACCTAGAGATGCTGATCGGGACC 329 

Qy 301 CCCCCGCAGAAGCTACAGATTCTCGTTGACACTGGAAGCAGTAACTTTGCCGTGGCAGGA 360 

II I II I II II I I I I I I I M I I II I I I II I I I II II II I I I I I I M I M I II I I 
Db 330 CCTCCGCAGAAGGTACAGATTCTTGTGGACACTGGAAGCAGTAACTTCGCTGTGGCAGGT 389 

Qy 361 ACCCCGCACTCCTACATAGACACGTACTTTGACACAGAGAGGTCTAGCACATACCGCTCC 420 

II I I I II II I I I I II I I II I I II I I I I I II I II II II II llllllllll I I M 
Db 390 GCCCCACACTCCTACATAGACACCTACTTTGACTCAGAGAGCTCCAGCACATACCACTCC 449 

Qy 421 AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 480 

|| II M I I I II I I I II I II II I II I I II II I I II II I I I I I II II I I I II I II 
Db 450 AAGGGCTTTGATGTCACTGTGAAGTACACACAGGGAAGCTGGACTGGCTTTGTTGGTGAG 509 

Qy 481 GACCTCGTCACCATCCCCAAAGGCTTCAATACTTCTTTTCTTGTCAACATTGCCACTATT 540 

Mill I I I II I I II II II II I I II I I I I I I II I I I M M II II I I I I I I I I 
Db 510 GACCTTGTCACCATCCCAAAAGGCTTCAACAGCTCTTTCTTGGTCAATATTGCCACTATT 569 

Qy 541 TTTGAATCAGAGAATTTCTTTTTGCCTGGGATTAAATGGAATGGAATACTTGGCCTAGCT 600 

M II II II I I II II II II I I I II I I I M I I M II I I I II II II Mill II III 
Db 570 TTCGAGTCTGAGAATTTCTTTTTGCCTGGTATTAAATGGAATGGAATCCTTGGACTTGCT 629 

Qy 601 TATGCCACACTTGCCAAGCCATCAAGTTCTCTGGAGACCTTCTTCGACTCCCTGGTGACA 660 

I I I II I I II I I I I II I I I I I I I II II I I II II II II M II II I I I I I I 

Db 630 TATGCTGCTTTGGCCAAGCCATCAAGCTCTCTGGAGACATTTTTTGATTCCCTGGTGGCC 689 

Qy 661 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 720 

II I I II II II II II I I I I I I II I II II I II I M II II II Mill II III 

Db 690 CAAGCAAAGATTCCAGACATTTTCTCCATGCAGATGTGCGGGGCTGGATTGCCAGTAGCT 749 



Qy 



721 GGATCTGGGACCAACGGAGGTAGTCTTGTCTTGGGTGGAATTGAACCAAGTTTGTATAAA 780 







|| | | 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


750 


GGTTCTGGTACCAACGGAGGTAGTCTTGTCCTGGGTGGGATTGAACCAAGTTTGTATAAA 


809 


QY 


781 


GGAGACATCTGGTATACCCCTATTAAGGAAGAGTGGTACTACCAGATAGAAATTCTGAAA 


840 




I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II II 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 

| | | | | ||| III 11*11' Willi ■ ■ ll piiff»»» * » 




Db 


810 


GGAGATATCTGGTATACC CCAATTAAAGAGGAATGGTACTATCAAATAGAAATCC TGAAG 


869 


Qy 


841 


TTGGAAATTGGAGGCCAAAGCCTTAATCTGGACTGCAGAGAGTATAACGCAGACAAGGCC 


900 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 III II 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 

||||t|||||1llllll | fit ((l|(lliiiiTJP!i#J!Pff*****»»~""" 




Db 


870 


TTGGAAATTGGAGGCCAGAACCTCAACCTGGACTGCAGAGAGTATAACGCAGACAAGGCC 


929 


Qy 


901 


ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 


960 




II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

II llllllllllllllllllii iifiiiiiiffiiii»**»i»ii""i"""* » 




nb 


930 


ATTGTGGACAGTGGCACCACGCTCCTGCGCCTGCCCCAGAAGGTGTTTGATGCAGTGGTG 


989 


Qy 


961 


GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 


1020 




1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 II 

||||||||||| || ||||||||lfllllll IT ■■llfivi www v 




nb 


990 


GAAGCTGTGGCACGAACATCTCTGATTCCAGAGTTTTCTGATGGCTTCTGGACAGGGGCC 


1049 


Qy 


1021 


CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 


1080 




1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II IN 1 II 1 1 1 1 1 1 1 1 II II Ml 

■ ■ill III | | | 1 I 1 1 1 I I I I ■ IIIII II IIP P ■» »• »• 






1050 


CAGCTGGCATGCTGGACAAATTCTGAAACGCCATGGGCATATTTCCCTAAGATTTCTATC 


1109 


Qy 


1081 


TACCTGAGAGATGAGAACTCCAGCAGGTCATTCCGTATCACAATCCTGCCTCAGCTTTAC 


1140 




1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 II IIIII IIIII II II M 1 1 1 1 1 Ml 

||l||||||||llllll llll 1 II 1 1 P P 1 1 1 P P P P » » » 






1110 


TACCTGAGAGATGAGAATGCC AGTCGC TC CTTCCGGATCACCATTCTCCCACAGCTCTAC 


1169 


Qy 


1141 


ATTCAGCCCATGATGGGGGCCGGCCTGAATTATGAATGTTACCGATTCGGCATTTCCCCA 


1200 




lllllllllllllllll II II 1 1 1 1 1 1 1 1 1 1 1 1 IIIII II II II Ml 1 

lllllllllllllllll II II 1 111111111*1 P P » I • I » »■ 






1170 


ATTCAGCCCATGATGGGAGCTGGTTTCAATTATGAATGCTACCGTTTTGGTATCTCCTCT 


1229 


Qy 


1201 


TCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGAC 


1260 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 IIIII II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 llll III 

IllllJJIIIflltllllll iiiii ll iiiiiiii iiiff»ii»f« ■ * 






1230 


TCCACAAATGCGCTGGTGATTGGTGCGACCGTGATGGAAGGCTTCTACGTGGTCTTTGAC 


1289 


Qy 


1261 


AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 


1320 




IIIII llll 1 It 1 1 1 1 1 1 1 1 1 llll III 1 1 1 II 1 1 1 1 1 1 llll llll 1 II 

IIIII llll llllllllllll llll III iviipijvt*** ■■«* i 




Db 


1290 

^b> M «^ 


AGAGCTCAGAGGAGGGTGGGCTTTGCAGTGAGTCCCTGTGCAGAGATTGAAGGTACCACA 


1349 


Qy 


1321 


GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 


1380 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 IIIII II M M M M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II II 

llllllllllllll IIIII ll ii ■* 




Db 


1350 


GTGTCTGAAATTTCTGGGCCCTTTTCCACGGAAGACATAGCCAGCAACTGTGTTCCAGCA 


1409 


\ 

Qy 


1381 


CAGTCTTTGAGCGAGCCCATTTTGTGGATTGTGTCCTATGCGCTCATGAGCGTCTGTGGA 


1440 




M I II Ml 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 II 1 1 1 1 1 1 

III || 111 llllllli |||lillifi*iiii*i** p * ■ m w w w w v ■* w r r w 




Db 


1410 


CAGGCTCTGAATGAGCCCATCTTGTGGATTGTGTCCTATGCCCTGATGAGTGTGTGTGGA 


1469 


Qy 


1441 


GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 


1500 




I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 t 1 1 1 1 1 1 1 1 1 1 1 1 1 1 III II llll 




Db 


1470 


GCCATTCTCCTGGTTCTGATCCTCCTCCTGCTGCTCCCGCTGCACTGCCGTCATGCCCCC 


1529 


Qy 


1501 


CGTGACCCTGAGGTCGTCAATGATGAGTCCTCTCTGGTCAGACATCGCTGGAAATGAATA 


1560 




|| | | 1 1 1 1 1 1 1 1 1 II II 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1530 


CGAGACCCTGAGGTAGTTAACGATGAGTCCTCACTAGTCAGACATCGCTGGAAATGAAGA 


1589 


Qy 


1561 


GCCAGGCCTGACCTCAAGCAACCATGAACTCAGCTATTAAGAAAATCACATTTCCAGGGC 


1620 



III 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II III llll 



Db 1590 GCCTCACCTGAACTCCAGCAGCCTTGAACTCAGCTCTTCCAAGAGGGACACCTCCA 1645 



Qy 1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 1680 

II I I I I I I I I I III I I I I I II 
Db 1646 GTTGGCTTCTCTGCCTATTAGTCGGGAACCTCAACTGT 1683 

Qy 1681 GCTCCCAGATGCCTTCTAGATTCACTGTCTTTTGATTCTTGATTTTCAAGCTTTCAAATC 1740 

|| I I I I I I I I I I I I I III I I I I I I 1 I I I I I I I I I I I M I I I I 
Db 1684 GCAACTGAATGCC TTCCAGACTGTATCT - TGATTACTCTTGATTTCCAAGCTTTCAGATC 1742 

Qy 1741 CTCCCTACTTCCAAGAAAAATAATTAAAAAAAAAACTTCATTCTAAACCAAAAAA 1795 

I I I I I I I I | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1743 TTTTCTACTTCAGAGAGAAATGA-TAATAAAAACACCTCATTGTGAACCAAAACA 1796 
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AK052309 
LOCUS 

DEFINITION 



ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 
MEDLINE 
PUBMED 

REFERENCE 
AUTHORS 

TITLE 

JOURNAL 
MEDLINE 
PUBMED 
REFERENCE 
AUTHORS 



TITLE 

JOURNAL 
MEDLINE 
PUBMED 
REFERENCE 
AUTHORS 



AK052309 1810 bp mRNA linear HTC 20-SEP-2003 

Mus rausculus 13 days embryo heart cDNA, RIKEN full-length enriched 
library, clone :D330025D14 product : beta-site APP-cleaving enzyme 2, 
full insert sequence. 
AK052309 

AK052309 . 1 GI : 26342548 
HTC ; CAP trapper . 
Mus musculus (house mouse) 
Mus musculus 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Rodentia; Sciurognathi ; Muridae; Murinae; Mus. 
1 

Carninci , P . and Hayashizaki , Y . 

High-efficiency full-length cDNA cloning 

Meth. Enzymol. 303, 19-44 (1999) 

99279253 

10349636 

2 

Carninci, P., Shibata,Y., Hayatsu,N. , Sugahara,Y. , Shibata,K. , 

Itoh,M. , Konno,H., Okazaki,Y., Muramatsu,M. and Hayashizaki ,Y. 

Normalization and subtraction of cap-trapper-selected cDNAs to 

prepare full-length cDNA libraries for rapid discovery of new genes 

Genome Res. 10 (10), 1617-1630 (2000) 

20499374 

11042159 

3 

Shibata,K. , Itoh,M. , Aizawa,K. , Nagaoka,S. , Sasaki, N., Carninci, P., 
Konno,H., Akiyama, J. , Nishi,K., Kitsunai,T., Tashiro,H., Itoh,M. , 
Sumi,N., Ishii,Y., Nakamura,S., Hazama,M. , Ni shine, T. , Harada,A. , 
Yamamoto,R., Matsumoto,H. , Sakaguchi , S . , Ikegami,T., Kashiwagi ,K. , 
Fujiwake,S., Inoue,K. , Togawa,Y., Izawa,M. , Ohara,E. , Watahiki,M. , 
Yoneda,Y., Ishikawa,T. , Ozawa,K. , Tanaka,T. , Matsuura,S., Kawai,J., 
Okazaki,Y., Muramatsu,M. , Inoue,Y., Kira,A. and Hayashizaki ,Y. 
RIKEN integrated sequence analysis (RISA) system — 384-format 
sequencing pipeline with 384 multi capillary sequencer 
Genome Res. 10 (11), 1757-1771 (2000) 
20530913 
11076861 
4 

The RIKEN Genome Exploration Research Group Phase II Team and the 



TITLE 
JOURNAL 
REFERENCE 
AUTHORS 

TITLE 

JOURNAL 
REFERENCE 
AUTHORS 



TITLE 
JOURNAL 



COMMENT 



FEATURES 

source 



CDS 



FANTOM Consortium. 

Functional annotation of a full-length mouse cDNA collection 

Nature 409, 685-690 (2001) 

5 

The FANTOM Consortium and the RIKEN Genome Exploration Research 
Group Phase I & II Team. 

Analysis of the mouse transcriptome based on functional annotation 
of 60,770 full-length cDNAs 
Nature 420, 563-573 (2002) 
6 (bases 1 to 1810) 

Adachi , J. , Aizawa , K . , Akimura , T . , Arakawa ,T. , Bono ,H. , Carninci , P . , 
Fukuda,S., Furuno,M. , Hanagaki,T., Hara,A. , Hashizume,W. , 
Hayashida,K. , Hayatsu,N. , Hiramoto,K. , Hiraoka,T. , Hirozane,T., 
Hori,F., Imotani,K., Ishii,Y., Itoh,M. , Kagawa,I., Kasukawa,T. , 
Katoh,H. , Kawai,J., Kojima,Y., Kondo,S., Konno,H., Kouda,M. , 
Koya , S . , Kurihara , C . , Matsuyama , T . , Miyazaki , A . , Murata ,M. , 
Nakamura,M. , Nishi,K., Nomura ,K. , Numazaki,R., Ohno,M. , Ohsato,N. , 
Okazaki,Y., Saito,R. , Saitoh, H. , Sakai,C, Sakai,K., Sakazume,N. , 
Sano,H., Sasaki, D. , Shibata,K. , Shinagawa,A. , Shiraki,T. , 
Sogabe , Y . , Tagami , M . , Tagawa ,A. , Takahashi , F . , Takaku-Akahira , S . , 
Takeda,Y. , Tanaka,T. , Tomaru,A. , Toya,T. , Yasunishi , A. , 
Muramatsu,M. and Hayashizaki , Y . 
Direct Submission 

Submitted (16-JUL-2001) Yoshihide Hayashizaki, The Institute of 
Physical and Chemical Research (RIKEN) , Laboratory for Genome 
Exploration Research Group, RIKEN Genomic Sciences Center (GSC) , 
RIKEN Yokohama Institute; 1-7-22 Suehiro-cho, Tsurumi-ku, Yokohama, 
Kanagawa 230-0045, Japan (E-mail : genome-res@gsc. riken. go. jp, 
URL : http : //genome . gsc . riken . go . jp/ , Tel : 8 1-45-503-9222 , 
Fax:81-45-503-9216) 

cDNA library was prepared and sequenced in Mouse Genome 
Encyclopedia Project of Genome Exploration Research Group in Riken 
Genomic Sciences Center and Genome Science Laboratory in RIKEN. 
Division of Experimental Animal Research in Riken contributed to 
prepare mouse tissues . 

Please visit our web site for further details. 
URL : http : //genome . gsc . riken . go . jp/ 
URL: http: //f ant om. gsc. riken . go . jp/ . 

Location/ Qualifiers 

1. .1810 

/organism="Mus musculus" 

/mol_type= " mRNA" 

/strain="C57BL/6J" 

/db_xref = " FANTOM_DB :D330025D14" 

/db_xref ="MGI : 2421341" 

/db_xref=" taxon: 10090" 

/clone="D330025D14 ,! 

/ 1 i s sue_type= " heart " 

/clone_lib="RIKEN full-length enriched mouse cDNA library" 
/dev_stage="13 days embryo" 
62. .1606 

/note=" unnamed protein product; beta-site APP-cleaving 

enzyme 2 (MGD |MGI : 1860440 , GB |NM_019517 , evidence: BLASTN, 

99%, match=1774) 

putative " 

/codon_start=l 

/protein id="BAC34931 . 1" 



/ db_xr e f = " GI : 2 6 3 4 2 5 4 9 " 

/ transl ation= " MGALLRALLLPVXAQWLLS AVPALAPAPFTLPLQVARATNHRAS 
AVPGLGTPELPRADGLALALEPVRATANFLAMVDNLQGDSGRGYYIJSMLIGTPPQKVQ 
I LVDTGS SNFAVAGAPHS YIDTYFDSES S STYHSKGFDVTVKYTQGSWTGFVGEDLVT 
I PKGFNS S FLVNI AT I FE SENFFLPGI KWNGI LGLAYAALAKP S S S LETFFD S LVAQA 
KIPDIFSMQMCGAGLPVAGSGTNGGSLVLGGIEPSLYKGDIWYTPIKEEWYYQIEILK 

LEI GGQNLNLDCRE YNADKAI VD S GTTLLRLPQKVFD AWEAVARTSL I PE FSDGFWT 
GAQLACWTNSETPWAYFPKI S I YLRDENASRSFRTTI LPQLYI QPMMGAGFNYECYRF 
GI S S STNALVI GATVMEGF YWFDRAQRRVGFAVS PCAE I EGTTVSEI S GPFS TED I A 
SNCVPAQALNEPI LWI VS YALMS VCGAI LLVLI LLLLLPLHCRHAPRDPEWNDESSL 
VRHRWK" 

polyA_signal 1787. .1792 

/ no te= " putative " 

polyA_site 1810 

/ no te= M putative" 

ORIGIN 

Query Match 65.3%; Score 1177.8; DB 11; Length 1810; 

Best Local Similarity 80.5%; Pred. No. 8.7e-164; 

Matches 1431; Conservative 0; Mismatches 307; Indels 39; Gaps 3; 

Qy 1 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

I I I I I I I I I I I I I I I I I I I I I I t I I I I 1 I I I I I I I I I I I I I I I I 
Db 62 ATGGGCGCGCTGCTTCGAGCACTCTTGCTCCCGGTGCTGGCGCAGTGGCTCTTGAGTGCG 121 

Qy 61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 120 

I Ml | I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 122 GTCCCCGCGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCAAGTGGCCCGGGCCACGAAC 181 

Qy 121 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 180 

II || III I I I I I I I I I I I I I I I I I I I I I II I I I I II 

Db 182 CACAGAGCCTCGGCTGTTCCCGGACTCGGGACCCCCGAGTTGCCCCGGGCCGATGGTCTG 241 

Qy 181 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 240 

I I I I I I I I I I I I I I I I I I III I M I I I I I I I I I I I I III 

Db 242 GCCCTCGCACTGGAGCCTGTCAGGGC TACTGCCAACTTCTTGGCTATG 289 

Qy 241 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 300 

II M I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 290 GTGGACAACCTTCAGGGGGACTCTGGCCGCGGCTACTACCTAGAGATGCTGATCGGGACC 349 

Qy 301 CCCCCGCAGAAGCTACAGATTCTCGTTGACACTGGAAGCAGTAACTTTGCCGTGGCAGGA 360 

II I I I I I I I 1 I I I I I I I I I I I II I I I I I I I I M I I I I I I I I I I II I I I I I I I I 
Db 350 CCTCCGCAGAAGGTACAGATTCTTGTGGACACTGGAAGCAGTAACTTCGCTGTGGCAGGT 409 

Qy 361 ACCCCGCACTCCTACATAGACACGTACTTTGACACAGAGAGGTCTAGCACATACCGCTCC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 410 GCCCCACACTCCTAC ATAGACACCTACTTTGACTCAGAGAGC TC C AGC ACATACCACTCC 469 

Qy 421 AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 480 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 470 AAGGGCTTTGATGTCACTGTGAAGTACACACAGGGAAGCTGGACTGGCTTTGTTGGTGAG 529 



Qy 

Db 



481 
530 



GACCTCGTCACCATCCCCAAAGGCTTCAATACTTCTTTTCTTGTCAACATTGCCACTATT 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GACCTTGTCACCATCCCAAAAGGCTTCAACAGCTCTTTCTTGGTCAATATTGCCACTATT 



540 
589 



Qy 541 TTTGAATCAGAGAATTTCTTTTTGCCTGGGATTAAATGGAATGGAATACTTGGCCTAGCT 600 

II || || | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M IN 
Db 590 TTCGAGTCTGAGAATTTCTTTTTGCCTGGTATTAAATGGAATGGAATCCTTGGACTTGCT 649 

Qy 601 TATGCCACACTTGCCAAGCCATCAAGTTCTCTGGAGACCTTCTTCGACTCCCTGGTGACA 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II II I I I I I I I I I I 
Db 650 TATGCTGCTTTGGCCAAGCCATCAAGCTCTCTGGAGACATTTTTTGATTCCCTGGTGGCC 709 

Qy 661 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 720 

I I I I I I I I II II II I I I I I I I I II I I I I I I I I I II II II I I I I I II III 

Db 710 CAAGCAAAGATTCCAGACATTTTCTCCATGCAGATGTGCGGGGCTGGATTGCCAGTAGCT 769 

Qy 721 GGATCTGGGACCAACGGAGGTAGTCTTGTCTTGGGTGGAATTGAACCAAGTTTGTATAAA 780 

II | | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 770 GGTTCTGGTACCAACGGAGGTAGTCTTGTCCTGGGTGGGATTGAACCAAGTTTGTATAAA 829 

Qy 781 GGAGACATCTGGTATACCCCTATTAAGGAAGAGTGGTACTACCAGATAGAAATTCTGAAA 840 

I I I I I I I I I I I I I I I I I I I I I I I I II M I I I I I I I I II I I I I I I I I I I I I I 
Db 830 GGAGATATCTGGTATACCCCAATTAAAGAGGAATGGTACTATCAAATAGAAATCCTGAAG 889 

Qy 841 TTGGAAATTGGAGGCCAAAGCCTTAATCTGGACTGCAGAGAGTATAACGCAGACAAGGCC 900 

I I I I I I I I I I I I I I I I I I III II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 890 TTGGAAATTGGAGGCCAGAACCTCAACCTGGACTGCAGAGAGTATAACGCAGACAAGGCC 949 

Qy 901 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 

II | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I II 

Db 950 ATTGTGGACAGTGGCACCACGCTCCTGCGCCTGCCCCAGAAGGTGTTTGATGCAGTGGTG 1009 

Qy 961 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1020 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I III II 
Db 1010 GAAGCTGTGGCACGAACATCTCTGATTCCAGAGTTTTCTGATGGCTTCTGGACAGGGGCC 1069 

Qy 1021 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I II III I II I I I I I I I I II II Ml 
Db 1070 CAGCTGGCATGCTGGACAAATTCTGAAACGCCATGGGCATATTTCCCTAAGATTTCTATC 1129 

Qy 1081 TACCTGAGAGATGAGAACTCCAGCAGGTCATTCCGTATCACAATCCTGCCTCAGCTTTAC 1140 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I III II II M I I I I I M I 
Db 1130 TACCTGAGAGATGAGAATGCCAGTCGCTC CTTCCGGACCACCATTCTC CC ACAGCTCTAC 1189 

Qy 1141 ATTCAGCCCATGATGGGGGCCGGCCTGAATTATGAATGTTACCGATTCGGCATTTCCCCA 1200 

I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I M M M IN I 
Db 1190 ATTCAGCCCATGATGGGAGCTGGTTTCAATTATGAATGCTACCGTTTTGGTATCTCCTCT 1249 

Qy 1201 TCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGAC 1260 

I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I III 
Db 1250 TCCACAAATGCGCTGGTGATTGGTGCGACCGTGATGGAAGGCTTCTACGTGGTCTTTGAC 1309 

Qy 1261 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I II 
Db 1310 AGAGCTCAGAGGAGGGTGGGCTTTGCAGTGAGTCCCTGTGCAGAGATTGAAGGTACCACA 1369 

Qy 1321 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1380 

I I I I I I I I I I I I I I I I I I I II M M M M I I I I I I I I I I I I I I I I II II 
Db 1370 GTGTCTGAAATTTCTGGGCCCTTTTCCACGGAAGACATAGCCAGCAACTGTGTTCCAGCA 1429 

Qy 1381 CAGTCTTTGAGCGAGCCCATTTTGTGGATTGTGTCCTATGCGCTCATGAGCGTCTGTGGA 1440 



Ill II III 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 II 1 1 1 1 1 1 

Db 1430 CAGGCTCTGAATGAGCCCATCTTGTGGATTGTGTCCTATGCCCTGATGAGTGTGTGTGGA 1489 

Qy 1441 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III II I I I I 

Db 1490 GCCATTCTCCTGGTTCTGATCCTCCTCCTGCTGCTCCCGCTGCACTGCCGTCATGCCCCC 1549 

Qy 1501 CGTGAC CCTGAGGTCGTCAATGATGAGTCC TC TCTGGTCAGACATCGCTGGAAATGAATA 1560 

II I I I I I I I I I I I II II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 1550 CGAGACCCTGAGGTAGTTAACGATGAGTCCTCACTAGTCAGACATCGCTGGAAATGAAGA 1609 

Qy 1561 GCCAGGCC TGACCTCAAGC AACCATGAAC TCAGC TATTAAGAAAATCACATTTCCAGGGC 1620 

III I I I I I I I I I I I I I I I I I I I I I I I II I I II 111 I I I I 

Db 1610 GCCTCACCTGAACTCCAGCAGCCTTGAACTCAGCTCTTCCAAGAGGGACACCTCCA 1665 

Qy 1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 1680 

II I I I I I I I I I III I I I I I II 
Db 1666 GTTGGCTTCTCTGCCTATTAGTCGGGAACCTCAACTGT 1703 

Qy 1681 GCTCCCAGATGCCTTCTAGATTCACTGTCTTTTGATTCTTGATTTTCAAGCTTTCAAATC 1740 

II I I I I II I I I I I I I III I I I I I I I I M I I I I I II I I I I I I I 
Db 1704 GCAACTGAATGCCTTCCAGACTGTATCT - TGATTACTC TTGATTTCCAAGCTTTC AGATC 1762 

Qy 1741 CTCCCTACTTCCAAGAAAAATAATTAAAAAAAAAACT 1777 

I I I I I I 1 I I I I I I I I I I I I I I I I I I I 
Db 1763 TTTTCTACTTCAGAGAGAAATGATAATAAAAACACCT 1799 



RESULT 3 
AY419487 
LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 



TITLE 

JOURNAL 
PUBMED 
REFERENCE 
AUTHORS 



TITLE 
JOURNAL 



AY419487 1245 bp DNA linear GSS 17-DEC-2003 

Homo sapiens BACE2 gene, VIRTUAL TRANSCRIPT, partial sequence, 
genomic survey sequence . 
AY419487 

AY419487 .1 GI : 39775444 
GSS. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chorda ta; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Primates; Catarrhini ; Hominidae; Homo. 

1 (bases 1 to 1245) 

Clark, A. G. , Glanowski , S . , Nielson,R. , Thomas,?., Ke jariwal , A. , 
Todd, M. A. , Tanenbaum,D.M. , Civello ,D . R. , Lu,F., Murphy , B. , 
Ferriera,S., Wang,G. , Zheng, X. H. , White, T. J., Sninsky , J . J. , 
Adams, M.D. and Cargill,M. 

Inferring nonneutral evolution from human -chimp -mouse orthologous 
gene trios 

Science 302 (5652) , 1960-1963 (2003) 
14671302 

2 (bases 1 to 1245) 

Clark,A.G., Glanowski , S . , Nielson,R. , Thomas, P., Ke jariwal , A. , 
Todd, M. A. , Tanenbaum,D.M. , Civello ,D . R. , Lu,F. , Murphy, B. , 
Ferriera,S., Wang,G. , Zheng, X.H. , White, T. J., Sninsky, J. J. , 
Adams, M.D. and Cargill,M. 
Direct Submission 

Submitted (16-NOV-2003) Celera Genomics, 45 West Gude Drive, 
Rockville, MD 20850, USA 



COMMENT These sequences were made by sequencing genomic exons and ordering 

them based on alignment. 
FEATURES Location/Qualif iers 

source 1. .1245 

/organism="Homo sapiens" 
/mol type=" genomic DNA" 
/db_xref=" taxon : 9 60 6 " 
gene <1. .>1245 

/gene="BACE2" 

/ locus_tag= " HCM6 907 " 

ORIGIN 

Query Match 61.8%; Score 1114.4; DB 29; Length 1245; 

Best Local Similarity 89.6%; Pred. No. 2.1e-154; 

Matches 1115; Conservative 0; Mismatches 130; Indels 0; Gaps 0; 

Qy 313 CTACAGATTCTCGTTGACACTGGAAGCAGTAACTTTGCCGTGGCAGGAACCCCGCACTCC 372 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I It t I I I I I I I I I I I I I I I I I I I I I I 
Db 1 CTACAGATTCTCGTTGACACTGGAAGCAGTAACTTTGCCGTGGCAGGAACCCCGCACTCC 60 

Qy 373 TACATAGACACGTACTTTGACACAGAGAGGTCTAGCACATACCGCTCCAAGGGCTTTGAC 432 

I | | | | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I M I I I M I I I I I I I M I I I I I I 
Db 61 TACATAGACACGTACTTTGACACAGAGAGGTCTAGCACATACCGCTCCAAGGGCTTTGAC 120 

Qy 433 GTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAAGACCTCGTCACC 492 

I I I I I I I I I II I I I I I I I I I II I I I I 1 I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I M 
Db 121 GTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAAGACCTCGTCACC 180 

Qy 493 ATCCCCAAAGGCTTCAATACTTCTTTTCTTGTCAACATTGCCACTATTTTTGAATCAGAG 552 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I 
Db 181 ATCCCCAAAGGCTTCAATACTTCTTTTCTTGTCAACATTGCCACTATTTTTGAATCAGAG 240 

Qy 553 AATTTCTTTTTGCCTGGGATTAAATGGAATGGAATACTTGGCCTAGCTTATGCCACACTT 612 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 241 AATTTCTTTTTGCCTGGGATTAAATGGAATGGAATACTTGGCCTAGCTTATGCCACACTT 300 

Qy 613 GCCAAGCCATCAAGTTCTCTGGAGACCTTCTTCGACTCCCTGGTGACACAAGCAAACATC 672 

I I I I I I 

Db 301 GCCAAGNNNNNNNNNNNNNNNNNNNNNNNNNN 360 

Qy 673 CCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCTGGATCTGGGACC 732 

Db 361 NNNNNNNNNNNNNNNNNNNNNNNNNNN^ 420 

Qy 733 AACGGAGGTAGTCTTGTCTTGGGTGGAATTGAACCAAGTTTGTATAAAGGAGACATCTGG 792 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 NNNNNNNNNNNNNNNGTCTTGGGTGGAATTGAACCAAGTTTGTATAAAGGAGACATCTGG 480 

Qy 793 TATACCCCTATTAAGGAAGAGTGGTACTACCAGATAGAAATTCTGAAATTGGAAATTGGA 852 

I I I I I I M I I M I I I I I I M I I I I I I I I I I I M I I I M I I I I I I I I I M I I I I I I I I I I I 
Db 481 TATACCCCTATTAAGGAAGAGTGGTACTACCAGATAGAAATTCTGAAATTGGAAATTGGA 540 

Qy 853 GGCCAAAGCCTTAATCTGGACTGCAGAGAGTATAACGCAGACAAGGCCATCGTGGACAGT 912 

| | | | | | | | I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 
Db 541 GGCCAAAGCCTTAATCTGGACTGCAGAGAGTATAACGCAGACAAGGCCATCGTGGACAGT 600 



913 GGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTGGAAGCTGTGGCC 972 







1 1 II 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 M 1 1 1 




Db 


601 


GGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTGGAAGCTGTGGCC 


660 


Qy 


973 


CGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCCCAGCTGGCGTGC 


1032 




1 1 1 1 II ! 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 t 1 1 1 1 I 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


661 

\J \J X 


CGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCCCAGCTGGCGTGC 


720 


Qy 


1033 


TGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATCTACCTGAGAGAT 


1092 




I II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 
I 1 1 1 1 1 1 i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i ■ ■ ■ i i > ■ t i i i i i i i i i i i i ■ 




UD 


791 


TGGAPGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATCTACCTGAGAGAC 


780 


Qy 


1093 


GAGAACTCCAGCAGGTCATTCCGTATCACAATCCTGCCTCAGCTTTACATTCAGCCCATG 


1152 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
1 l l l l I I I I I I i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i ■ i i i i i i i ■ i * ■ 






/ox 


GAGAAPTPrAGrAGGTCATTCCGTATCACAATCCTGCCTCAGCTTTACATTCAGCCCATG 


840 


Qy 


1153 


ATGGGGGCCGGCCTGAATTATGAATGTTACCGATTCGGCATTTCCCCATCCACAAATGCG 


1212 




1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 
1 1 1 1 1 I I I I I I I I I I I I I i i i i i i i i i i i i i i i i i i i i f i i i ■ ■ > ■ ■ ■ • i i i i i i i i i i i 




UD 


O fl X 


& Tnr:r:r;r;rr GGf* r* tg A A tt AT G A ATGT T AC C GATTC GGC ATTTC C C C ATC C AC AAATGC G 


900 


Qy 


1213 


CTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGACAGAGCCCAGAAG 


1272 




1 t 1 II 1 1 1 II 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 
1 f 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 i i i i i i i i i i i i i i i i i i i i i i i i i ■ ■ ■ ■ i ■ ■ i i i i i ■ i ■ ' 




UD 




r T RfiTfiA TP GGTGP C AC GGTGATGGAGGGC TTC T AC GT C ATC TTC GAC AGAGC C C AGAAG 


960 


Qy 


1273 


AGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCAGTGTCTGAAATT 


1332 




II 1 II 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 i i i i i i i i i t ■■■■ i > i i i i i ■ ■ i i i i ■ ■ ■ 1 1 1 








ArsrtrsTrtrirtrTTrfirAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCAGTGTCTGAAATT 


1020 


Qy 


1333 


TCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCTCAGTCTTTGAGC 


1392 




1 1 1 II 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 II II 1 1 1 1 1 1 1 1 1 1 1 
1 1 1 1 1 1 1 1 1 1 1 l l l l l l l l l l l I I I I i i i i i i i ) i i i i i ■ i i i i i i i i ■ i * ■ * ■ ■ ■ ■ ■ > > 








m r* radar rTTTPTrRAP A a A GG ATGT AGC C AGC AAC TGTGTC C C C GCTC AGTCTTTGAGC 


1080 


Qy 


1393 


GAGCCCATTTTGTGGATTGTGTCCTATGCGCTCATGAGCGTCTGTGGAGCCATCCTCCTT 


1452 




I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 




nu 
DZj 


1 nm 


G AGC CC ATTTTGTGGATTGTGTCCTATGC GCTC ATGAGCGTCTGTGGAGCCATCCTCCTT 


1140 


Qy 


1453 


GTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCCCGTGACCCTGAG 


1512 




I | | | | | | 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 




Db 


1141 


GTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCCCGTGACCCTGAG 


1200 


Qy 


1513 


GTCGTCAATGATGAGTCCTCTCTGGTCAGACATCGCTGGAAATGA 1557 






I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 




Db 


1201 


GTCGTCAATGATGAGTCCTCTCTGGTCAGACATCGCTGGAAATGA 1245 





RESULT 4 

BQ688240/C 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 



BQ688240 970 bp mRNA linear EST 15-JUL-2002 

AGENCOURT_8034236 NIH_MGC_110 Homo sapiens cDNA clone IMAGE : 6208269 
5 1 , mRNA sequence . 
BQ688240 

BQ688240 .1 GI : 21813556 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia ; Eutheria ; Primates ; Catarrhini ; Hominidae ; Homo . 
1 (bases 1 to 970) 



AUTHORS 
TITLE 
JOURNAL 
COMMENT 



FEATURES 

source 



NIH-MGC http://mgc.nci.nih.gov/. 

National Institutes of Health, Mammalian Gene Collection (MGC) 
Unpublished (1999) 

Contact : Robert S trausberg , Ph . D . 

Email: cgapbs-r@mail.nih.gov 

Tissue Procurement: ATCC 
cDNA Library Preparation: Rubin Laboratory 
cDNA Library Arrayed by: The I.M.A.G.E. Consortium (LLNL) 
DNA Sequencing by: Agencourt Bioscience Corporation 
Clone distribution: MGC clone distribution information can be 

found through the I.M.A.G.E. Consortium/ LLNL at : 

http : //image . llnl . gov 

Plate: LLCM2365 row: k column: 22 

High quality sequence stop: 631. 
Location/ Qualifiers 
1. .970 

/organism="Homo sapiens" 

/mol_type="mRNA" 

/ db_xref = " t axon : 9 6 0 6 " 

/clone=" IMAGE: 6208269" 

/tissue_type=" ductal carcinoma, cell line" 
/lab_host="DH10B (phage-resistant) " 
/ cl one_lib=" NIH_MGC_1 10" 

/note="Organ : pancreas ; Vector : pOTB7 ; Site_l : Xhol ; 
Site__2: EcoRI ; cDNA made by oligo-dT priming. 
Directionally cloned into EcoRI /Xhol sites using the 
following 5 1 adaptor: GGCACGAG(G) . Library constructed by 
Ling Hong in the laboratory of Gerald M. Rubin (University 
of California, Berkeley) using ZAP-cDNA synthesis kit 
(Stratagene) and Superscript II RT (Life Technologies) . 
Note: this is a NIH MGC Library." 



ORIGIN 



Query Match 50.4%; Score 910; DB 13; Length 970; 

Best Local Similarity 98.3%; Pred. No. 2.5e-124; 
Matches 930 ; Conservative 0 ; Mismatches 15 ; Indels 



1 ; Gaps 



1; 



QY 
Db 



829 GAAATTCTGAAATTGGAAATTGGAGGCCAAAGCCTTAATCTGGACTGCAGAGAGTATAAC 888 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
954 GAAATTCTGAAATTGGAATTTGGAGCCCAAAGCCTTAATCTGGACTGCAGAGAGTATAAC 895 



QY 
Db 



889 GCAGACAAGGCCATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTT 948 

I | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
894 GCAGCCAAGGCCATCGTGACCAGTGGCACCCCGCTGCTGCGCCTGCCCCAGAAGGTGTTT 835 



QY 
Db 

QY 
Db 



949 GATGCGGTGGTGGAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTC 1008 

I | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
834 GATGCGGTGGTGGAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGTTTTC 775 

1009 TGGACTGGGTCCC-AGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCC 1067 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I III 
774 TGGACTGGGTCCCAAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTACTTCCCC 715 



Qy 1068 TAAAATCTCCATCTACCTGAGAGATGAGAACTCCAGCAGGTCATTCCGTATCACAATCCT 1127 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 714 TAAAATCTCCATCTACCTGAGAGACGAGAACTCCAGCAGGTCATTCCGTATCACAATCCT 655 



Qy 1128 GCCTCAGCTTTACATTCAGCCCATGATGGGGGCCGGCCTGAATTATGAATGTTACCGATT 1187 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 654 GCCTCAGCTTTACATTCAGCCCATGATGGGGGCCGGCCTGAATTATGAATGTTACCGATT 595 

Qy 1188 CGGCATTTCCCCATCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTA 1247 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 
Db 594 CGGCATTTCCCCATCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTA 535 

Qy 1248 CGTCATCTTCGACAGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAAT 1307 

I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 534 CGTCATCTTCGACAGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAAT 475 

Qy 1308 TGCAGGTGCTGCAGTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAA 1367 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 474 TGCAGGTGCTGCAGTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAA 415 

Qy 1368 CTGTGTCCCCGCTCAGTCTTTGAGCGAGCCCATTTTGTGGATTGTGTCCTATGCGCTCAT 1427 

I I I I I I I I I I I I I I I I I I I I! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 414 CTGTGTCCCCGCTCAGTCTTTGAGCGAGCCCATTTTGTGGATTGTGTCCTATGCGCTCAT 355 

Qy 1428 GAGCGTCTGTGGAGCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTG 1487 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 354 GAGCGTCTGTGGAGCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTG 295 

Qy 1488 TCAGCGTCGCCCCCGTGACCCTGAGGTCGTCAATGATGAGTCCTCTCTGGTCAGACATCG 1547 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 294 TCAGCGTCGCCCCCGTGACCCTGAGGTCGTCAATGATGAGTCCTCTCTGGTCAGACATCG 235 

Qy 1548 CTGGAAATGAATAGCCAGGCCTGACCTCAAGCAACCATGAACTCAGCTATTAAGAAAATC 1607 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 234 CTGGAAATGAATAGCCAGGCCTGACCTCAAGCAACCATGAACTCAGCTATTAAGAAAATC 175 

Qy 1608 ACATTTCCAGGGCAGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTT 1667 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 174 ACATTTCCAGGGCAGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTT 115 

Qy 1668 CAATCTCTGTTCTGCTCCCAGATGCCTTCTAGATTCACTGTCTTTTGATTCTTGATTTTC 1727 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I 

Db 114 CAATCTCTGTTCTGCTCCCAGATGCCTTCTAGATTCACTGTCTTTTGATTCTTGATTTTC 55 

Qy 1728 AAGCTTTCAAATCCTCCCTACTTCCAAGAAAAATAATTAAAAAAAA 1773 

II I I I I I I I I I I I I I I I 11 I I I I II I I I I I I I I II I I I I I I I I 
Db 54 AAGCTTTCAAATCCTCCCTACTTCCAAGAAAAAAAAAAAAAAAAAA 9 



RESULT 5 

BX401345/c 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



BX401345 1015 bp mRNA linear EST 13-MAY-2003 

BX401345 Homo sapiens HELA CELLS COT 2 5 -NORMALI ZED Homo sapiens 
cDNA clone CS0DK012YC20 3-PRIME, mRNA sequence. 
BX401345 

BX401345 .1 GI : 30614534 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebra ta; Euteleostomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



FEATURES 

source 



1 (bases 1 to 1015) 

Li,W.B., Gruber,C, Jessee,J. and Pol ayes , D . 
Full-length cDNA libraries and normalization 
Unpublished (2001) 
Contact: Genoscope 

Genoscope - Centre National de Sequencage 
BP 191 91006 EVRY cedex - France 

Email : seqref @ genoscope . ens . f r , Web : www . genoscope . ens . f r 
Library was constructed by Life Technologies, a division of 
Invitrogen. This sequence belongs to sequence cluster 10331. f For 
more information about this cluster, see 
http : / /www . genoscope . ens . f r / 

cgi -bin/cluster . cgi?seq=CS0DK012BB10NPl&cluster=10331 . f . Contact : 
Feng Liang Email : fliang@lifetech.com URL : 

http : / /full length . invitrogen . com/ InVi troGen Corporation 1600 
Faraday Avenue Genoscope sequence ID : CSODK012BB10NP1 . 

Location/Qualifiers 

1. .1015 

/organism="Homo sapiens" 
/mo l_type= " mRNA " 
/dbjeref =" taxon : 9606" 
/clones" CS0DK0 12 YC20 " 

/cell_type="HELA CELLS COT 2 5 -NORMALIZED" 
/cell_line="HELA" 

/clone_lib="Homo sapiens HELA CELLS COT 2 5 -NORMALIZED 11 
/note="lst strand cDNA was primed with a Notl-oligo (dT) 
primer. Five prime end enriched, double -strand cDNA was 
digested with Not I and cloned into the Not I and EcoR V 
sites of the pCMVSPORT 6 vector. Library was normalized. 11 



ORIGIN 



Query Match 49.6%; Score 894.4; DB 13; Length 1015; 

Best Local Similarity 97.5%; Pred. No. 4.9e-122; 
Matches 948; Conservative 12; Mismatches 6; Indels 



6 ; Gaps 



5; 



Qy 

Db 



827 TAGAAATTCTGAAATTGGAAATTGGAGGCCAAAGCCTTAATCTGGACTGCAGAGAGTATA 886 

I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I : I I I I I I I I I I I I I I I I I I t I I I I I I I I M I 
1015 TAGAAATTCTGAAA-TGGAAATTGGAGGCMAAAGCCTTAATCTGGACTGCAGAGAGTATA 957 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



887 ACGCAGACAAGGCCATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGT 946 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I: I I I I I I I I I I I I I I I I I I I I 
956 ACGCAGACAAGGCCATCGTGGACAGTGGCACCACGCTS — GCGCCTGCCCCAGAAGGTGT 899 

947 TTGATGCGGTGGTGGAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTT 1006 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
898 TTGATGCGGTGGTGGAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTT 839 

1007 TCTGGACTGGGTCCCAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCC 1066 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
838 TCTGGACTGGGTCCCAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCC 779 

1067 CTAAAATCTCCATCTACCTGAGAGATGAGAACTCCAGCAGGTCATTCCGTATCACAATCC 1126 

I | | | | I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
778 CTAAAATCTCCATCTACCTGAGAGACGAGAACTCCAGCAGGTCATTCCGTATCACAATCC 719 



Qy 



1127 



TGCCTCAGCTTTACATTCAGCCCATGATGGGGGCCGGCCTGAATTATGAATGTTACCGAT 
I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



1186 



Db 



718 TGCCTCAGCTTTACATTCAGCCCATGATGGGGGCCGGCCTGAATTATGAATGTTACCGAT 659 



Qy 1187 TCGGCATTTCCCCATCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCT 1246 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 658 TCGGCATTTCCCCATCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCT 599 

Qy 1247 ACGTCATCTTCGACAGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAA 1306 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I : I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 598 ACGTC ATCTTCGACAGAGCCCAGAAGAGGGT- GGS TTCGCAGCGAGCCCC TGTGCAGAAA 540 

Qy 1307 TTGCAGGTGCTGCAGTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCA 1366 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 539 TTGCAGGTGCTGCAGTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCA 480 

Qy 1367 ACTGTGTCCCCGCTCAGTCTTTGAGCGAGCCCATTTTGTGGATTGTGTCCTATGCGCTCA 1426 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 479 ACTGTGTCCCCGCTCAGTCTTTGAGCGAGCCCATTTTGTGGATTGTGTCCTATGCGCTCA 420 

Qy 1427 TGAGCGTCTGTGGAGCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGT 1486 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 419 TGAGCGTCTGTGGAGCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTG-CGTTCCGGT 361 

Qy 1487 GTCAGCGTCGCCCCCGTGACCCTGAGGTCGTCAATGATGAGTCCTCTCTGGTCAGACATC 1546 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I 
Db 360 GTCAGCGTCGCCCCCGTGACCCTGAGGTCGTCAATGATGAGTCCTCTCTGGTCAGACATC 301 

Qy 1547 GCTGGAAATGAATAGCCAGGCCTGACCTCAAGCAACCATGAACTCAGCTATTAAGAAAAT 1606 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I : 
Db 300 GCTGGAAATGAATAGCCAGGCCTGACCTCAAGCAACCATGAACTCAGCTATTAAGAAAAW 241 

Qy 1607 CACATTTCCAGGGCAGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCT 1666 

I I I I I I I M I I I I I I I I I I I : I I I I I I I I : I II I I I I I I : I I I II I I I I I I I I I I I : I I : 
Db 240 CACATTTCCAGGGCAGCAGCMGGGATCGAHGGTGGCGCTHTCTCCTGTGCCCACCCSTCH 181 

Qy 1667 TCAATCTCTGTTCTGCTCCCAGATGCCTTCTAGATTCACTGTCTTTTGATTCTTGATTTT 1726 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 180 TCAATCTCTGTTCTGCTCCCAGATGCCTTCTAGATACACTGTCTTTTGATTCTTGATTTT 121 

Qy 1727 CAA-GCTTTCAAATCCTCCCTACTTCCAAGAAAAATAATTAAAAAAAAAACTTCATTCTA 1785 

III I I I I I I I I I I I I I I I I : I I I I I I I I I : I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 120 CAAGGCTTTCAAATCCTCCCGRCTTCCAAGAMAAATAATTAAAAAAAAAACTTCATTCTA 61 

Qy 1786 AACCAAAAAAAA 1797 

I : I I I I I I I 
Db 60 ATYCAAAACAGA 49 



RESULT 6 
AY419489 
LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



AY419489 1245 bp DNA linear GSS 17-DEC-2003 

Mus mus cuius BACE2 gene, VIRTUAL TRANSCRIPT, partial sequence, 
genomic survey sequence . 
AY419489 

AY419489 . 1 GI : 39775446 
GSS. 

Mus musculus (house mouse) 
Mus musculus 



REFERENCE 
AUTHORS 



TITLE 

JOURNAL 
PUBMED 
REFERENCE 
AUTHORS 



TITLE 
JOURNAL 

COMMENT 

FEATURES 

source 



gene 



Eukaryota; Metazoa; Chordata; Craniata; Vertebra ta; Euteleostomi ; 
Mammalia; Eutheria; Rodentia; Sciurognathi ; Muridae; Murinae; Mus. 

1 (bases 1 to 1245) 

Clark, A. G., Glanowski , S . , Nielson,R. , Thomas,?., Ke jariwal , A. , 
Todd, M. A. , Tanenbaum,D.M. , Civello,D.R. , Lu,F. , Murphy ,B. , 
Ferriera,S. , Wang,G. , Zheng,X.H. , White, T.J. , Sninsky,J. J. , 
Adams ,M.D. and Cargill,M. 

Inferring nonneutral evolution from human -chimp-mouse orthologous 
gene trios 

Science 302 (5652) , 1960-1963 (2003) 
14671302 

2 (bases 1 to 1245) 

Clark, A. G. , Glanowski , S . , Nielson,R. , Thomas, P., Kejariwal , A. , 
Todd, M. A. , Tanenbaum,D.M. , Civello,D.R. , Lu,F. , Murphy, B. , 
Ferriera,S., Wang,G. , Zheng, X. H. , White, T. J., Sninsky, J. J. , 
Adams, M.D. and Cargill,M. 
Direct Submission 

Submitted (16-NOV-2003) Celera Genomics, 45 West Gude Drive, 
Rockville, MD 20850, USA 

These sequences were made by sequencing genomic exons and ordering 
them based on alignment. 

Location/Qualifiers 

1. .1245 

/organism="Mus musculus" 
/mol type=" genomic DNA" 
/db_xref="taxon: 10090" 
<1. .>1245 
/gene="BACE2" 
/locus tag= lf HCM6907" 



ORIGIN 



Query Match 47.4%; Score 855.8; DB 29; Length 1245; 

Best Local Similarity 76.6%; Pred. No. 2.2e-116; 

Matches 953; Conservative 0; Mismatches 291; Indels 0; Gaps 



0; 



Qy 

Db 



314 TACAGATTCTCGTTGACACTGGAAGCAGTAACTTTGCCGTGGCAGGAACCCCGCACTCCT 373 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I 
2 TACAGATTCTTGTGGACACTGGAAGCAGTAACTTCGCTGTGGCAGGTGCCCCACACTCCT 61 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



374 ACATAGACACGTACTTTGACACAGAGAGGTCTAGCACATACCGCTCCAAGGGCTTTGACG 433 

I I I I I I I I I I I It I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
62 ACATAGACACCTACTTTGACTCAGAGAGCTCCAGCACATACCACTCCAAGGGCTTTGATG 121 



434 



494 



493 



TCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAAGACCTCGTCACCA 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
122 TCACTGTGAAGTACACACAGGGAAGCTGGACTGGCTTTGTTGGTGAGGACCTTGTCACCA 181 



553 



TCCCCAAAGGCTTCAATACTTCTTTTCTTGTCAACATTGCCACTATTTTTGAATCAGAGA 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I 
182 TCCCAAAAGGCTTCAACAGCTCTTTCTTGGTCAATATTGCCACTATTTTCGAGTCTGAGA 241 

554 ATTTCTTTTTGCCTGGGATTAAATGGAATGGAATACTTGGCCTAGCTTATGCCACACTTG 613 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
242 ATTTCTTTTTGCCTGGTATTAAATGGAATGGAATCCTTGGACTTGCTTATGCTGCTTTGG 301 



Qy 



614 CCAAGCCATCAAGTTCTCTGGAGACCTTCTTCGACTCCCTGGTGACACAAGCAAACATCC 673 
I I I I I 



Db 302 CCAAGNNNNNNNNNNNE^ 36 1 

Qy 674 CCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCTGGATCTGGGACCA 733 

Db 362 NNNNNNNNNNNNNNNNNNNNNNNNNNN^ 421 

Qy 734 ACGGAGGTAGTCTTGTCTTGGGTGGAATTGAACCAAGTTTGTATAAAGGAGACATCTGGT 793 

III I I I I It I | I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I 
Db 422 NNNNNNNNNNNNNNGTCCTGGGTGGGATTGAACCAAGTTTGTATAAAGGAGATATCTGGT 481 

Qy 794 ATACCCCTATTAAGGAAGAGTGGTACTACCAGATAGAAATTCTGAAATTGGAAATTGGAG 853 

I I I I I I I I I I I I II II I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 482 ATACCCCAATTAAAGAGGAATGGTACTATCAAATAGAAATCCTGAAGTTGGAAATTGGAG 541 

Qy 854 GCCAAAGCCTTAATCTGGACTGCAGAGAGTATAACGCAGACAAGGCCATCGTGGACAGTG 913 

I I I I I Ml II I I I I I I I M I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 542 GCCAGAACCTCAACCTGGACTGCAGAGAGTATAACGCAGACAAGGCCATTGTGGACAGTG 601 

Qy 914 GCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTGGAAGCTGTGGCCC 973 

I | I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 602 GCACCACGCTCCTGCGCCTGCCCCAGAAGGTGTTTGATGCAGTGGTGGAAGCTGTGGCAC 661 

Qy 974 GCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCCCAGCTGGCGTGCT 1033 

I | | | | | | | I I I I I I I I I II I I I I II I I II I I I I I I III I I I I I I I I I I I I I I 
Db 662 GAACATCTCTGATTCCAGAGTTTTCTGATGGCTTCTGGACAGGGGCCCAGCTGGCATGCT 721 

Qy 1034 GGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATCTACCTGAGAGATG 1093 

I I I I | | I I I I I I I I II III I II MINIM II II I I I I I I I I I I I I I I I I 
Db 722 GGACAAATTCTGAAACGCCATGGGCATATTTCCCTAAGATTTCTATCTACCTGAGAGATG 781 

Qy 1094 AGAACTCCAGCAGGTCATTCCGTATCACAATCCTGCCTCAGCTTTACATTCAGCCCATGA 1153 

I I I I | | | | I II I I I I I I I I I I II II II I I I I I I I I I I I I I I I I I I I I I 
Db 782 AGAATGCCAGTCGCTCCTTCCGGATCACCATTCTCCCACAGCTCTACATTCAGCCCATGA 841 

Qy 1154 TGGGGGCCGGCCTGAATTATGAATGTTACCGATTCGGCATTTCCCCATCCACAAATGCGC 1213 

I I I I II II I I I I I I I I I I I I I I I I I II II II III I I I I I I I I I I I I II 
Db 842 TGGGAGCTGGTTTCAATTATGAATGCTACCGTTTTGGTATCTCCTCTTCCACAAATGCGC 901 

Qy 1214 TGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGACAGAGCCCAGAAGA 1273 

I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 902 TGGTGATTGGTGCGACCGTGATGGAAGGCTTCTACGTGGTCTTTGACAGAGCTCAGAGGA 961 

Qy 1274 GGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCAGTGTCTGAAATTT 1333 

I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 962 GGGTGGGCTTTGCAGTGAGTCCCTGTGCAGAGATTGAAGGTACCACAGTGTCTGAAATTT 1021 

Qy 1334 CCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCTCAGTCTTTGAGCG 1393 

I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I t I I I I I I I I I I I I 
Db 1022 CTGGGCCCTTTTCCACGGAAGACATAGCCAGCAACTGTGTTCCAGCACAGGCTCTGAATG 1081 

Qy 1394 AGCCCATTTTGTGGATTGTGTCCTATGCGCTCATGAGCGTCTGTGGAGCCATCCTCCTTG 1453 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I 
Db 1082 AGCCCATCTTGTGGATTGTGTCCTATGCCCTGATGAGTGTGTGTGGAGCCATTCTCCTGG 1141 

Qy 1454 TCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCCCGTGACCCTGAGG 1513 

I | | I I I I I I I I I I I I I I I I I I I III II II I I I I I I I I I I I I I I 
Db 1142 TTCTGATCCTCCTCCTGCTGCTCCCGCTGCACTGCCGTCATGCCCCCCGAGACCCTGAGG 1201 



Qy 1514 TCGTCAATGATGAGTCCTC TCTGGTCAGACATCGC TGGAAATGA 1557 

I II II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 1202 TAGTTAACGATGAGTCCTCACTAGTCAGACATCGCTGGAAATGA 1245 



RESULT 7 
BX401346 
LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



FEATURES 

source 



BX401346 1004 bp mRNA linear EST 13-MAY-2003 

BX401346 Homo sapiens HELA CELLS COT 2 5 -NORMALIZED Homo sapiens 
cDNA clone CS0DK012YC2O 5-PRIME, mRNA sequence. 
BX401346 

BX401346 .1 GI : 30618464 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chorda ta; Craniata; Vertebra ta; Euteleostomi ; 
Mammalia ; Eutheria ; Primates ; Catarrhini ; Hominidae ; Homo . 
1 (bases 1 to 1004) 

Li,W.B. , Gruber,C. , Jessee,J. and Polayes,D. 
Full-length cDNA libraries and normalization 
Unpublished (2001) 
Contact : Genoscope 

Geno scope - Centre National de Sequencage 
BP 191 91006 EVRY cedex - France 

Email: seqref@genoscope.cns.fr, Web : www.genoscope.cns.fr 
Library was constructed by Life Technologies, a division of 
Invitrogen. This sequence belongs to sequence cluster 10331. f For 
more information about this cluster, see 
http : / / www . genoscope . ens . f r/ 

cgi -bin/cluster . cgi?seq=CSODK012BBlOQPl&cluster=10331 . f . Contact : 
Feng Liang Email : fliang@lifetech.com URL : 

http://fulllength.invitrogen.com/ InVitroGen Corporation 1600 
Faraday Avenue Genoscope sequence ID : CS0DK012BB10QP1 . 

Location/ Qualifiers 

1. .1004 

/ organisms" Homo sapiens " 
/mol_type=" mRNA" 
/db_xref="taxon: 9606" 
/clone=" CSODKO 12YC20 " 

/ eel l_type= " HE LA CELLS COT 2 5 -NORMALIZED" 
/ eel l_line=" HELA" 

/clone_lib="Homo sapiens HELA CELLS COT 2 5 -NORMALIZED" 
/note="lst strand cDNA was primed with a Notl-oligo (dT) 
primer. Five prime end enriched, double-strand cDNA was 
digested with Not I and cloned into the Not I and EcoR V 
sites of the pCMVSPORT 6 vector. Library was normalized." 



ORIGIN 



Query Match 



45.5%; Score 821.6; DB 13; Length 1004; 
Best Local Similarity 99.9%; Pred. No. 2.5e-lll; 
Matches 821; Conservative 1; Mismatches 0; Indels 



0 ; Gaps 



0; 



QY 
Db 



1 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I 
180 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 239 



Qy 61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 120 

I I I I I I I I I I I I I I : I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 240 GCCCCGGAGCTGGCMCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 299 

Qy 121 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 300 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 359 

Qy 181 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 360 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 419 

Qy 241 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 300 

I I I I I I 1 I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I 
Db 420 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 479 

Qy 301 CCCCCGCAGAAGCTACAGATTCTCGTTGACACTGGAAGCAGTAACTTTGCCGTGGCAGGA 360 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 480 CCCCCGCAGAAGCTACAGATTCTCGTTGACACTGGAAGCAGTAACTTTGCCGTGGCAGGA 539 

Qy 361 ACCCCGCACTCCTACATAGACACGTACTTTGACACAGAGAGGTCTAGCACATACCGCTCC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I 
Db 540 ACCCCGCACTCCTACATAGACACGTACTTTGACACAGAGAGGTCTAGCACATACCGCTCC 599 

Qy 421 AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I 
Db 600 AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 659 

Qy 481 GACCTCGTCACCATCCCCAAAGGCTTCAATACTTCTTTTCTTGTCAACATTGCCACTATT 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I 
Db 660 GACCTCGTCACCATCCCCAAAGGCTTCAATACTTCTTTTCTTGTCAACATTGCCACTATT 719 

Qy 541 TTTGAATCAGAGAATTTCTTTTTGCCTGGGATTAAATGGAATGGAATACTTGGCCTAGCT 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 720 TTTGAATCAGAGAATTTCTTTTTGCCTGGGATTAAATGGAATGGAATACTTGGCCTAGCT 779 

Qy 601 TATGCCACACTTGCCAAGCCATCAAGTTCTCTGGAGACCTTCTTCGACTCCCTGGTGACA 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 780 TATGCCACACTTGCCAAGCCATCAAGTTCTCTGGAGACCTTCTTCGACTCCCTGGTGACA 839 

Qy 661 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 840 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 899 

Qy 721 GGATCTGGGACCAACGGAGGTAGTCTTGTCTTGGGTGGAATTGAACCAAGTTTGTATAAA 780 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 900 GGATCTGGGACCAACGGAGGTAGTCTTGTCTTGGGTGGAATTGAACCAAGTTTGTATAAA 959 

Qy 781 GGAGACATCTGGTATACCCCTATTAAGGAAGAGTGGTACTAC 822 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 960 GGAGACATCTGGTATACCCCTATTAAGGAAGAGTGGTACTAC 1001 



RESULT 8 
AY419488 

LOCUS AY419488 970 bp DNA linear GSS 17-DEC-2003 

DEFINITION Pan troglodytes BACE2 gene, VIRTUAL TRANSCRIPT , partial sequence, 



ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 



TITLE 

JOURNAL 
PUBMED 
REFERENCE 
AUTHORS 



TITLE 
JOURNAL 

COMMENT 

FEATURES 

source 



gene 



genomic survey sequence. 
AY419488 

AY419488.1 GI: 39775445 
GSS. 

Pan troglodytes (chimpanzee) 
Pan troglodytes 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia ; Eutheria ; Primates ; Catarrhini ; Hominidae ; Pan . 

1 (bases 1 to 970) 

Clark,A.G. , Glanowski , S . , Nielson,R. , Thomas, P., Kejariwal ,A. , 
Todd,M.A. , Tanenbaum,D.M. , Civello ,D . R. , Lu,F. , Murphy, B. , 
Ferriera,S. , Wang,G. , Zheng, X.H. , White, T.J. , Sninsky, J. J. , 
Adams, M.D. and Cargill,M. 

Inferring nonneutral evolution from human- chimp -mouse orthologous 
gene trios 

Science 302 (5652) , 1960-1963 (2003) 
14671302 

2 (bases 1 to 970) 

Clark, A. G. , Glanowski , S . , Nielson,R. , Thomas, P., Kejariwal , A. , 
Todd, M. A. , Tanenbaum,D.M. , Civello , D. R. , Lu,F. , Murphy, B. , 
Ferriera,S. , Wang,G. , Zheng, X.H., White, T. J., Sninsky , J. J. , 
Adams, M.D. and Cargill,M. 
Direct Submission 

Submitted (16-NOV-2003) Celera Genomics, 45 West Gude Drive, 
Rockville, MD 20850, USA 

These sequences were made by sequencing genomic exons and ordering 
them based on alignment. 

Location/ Qualifiers 

1. .970 

/organism="Pan troglodytes" 

/mo l_type=" genomic DNA" 

/db_xref=" taxon: 9598" 

<1. .>970 

/gene= M BACE2" 

/locus tag="HCM6907" 



ORIGIN 



Query Match 45.2%; Score 815.8; DB 29; 

Best Local Similarity 84.5%; Pred. No. 1.8e-110; 
Matches 820; Conservative 0; Mismatches 150; 



Length 970 



Indels 



0 ; Gaps 



0; 



Qy 

Db 



334 GGAAGCAGTAACTTTGCCGTGGCAGGAACCCCGCACTCCTACATAGACACGTACTTTGAC 393 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1 GGAAGCAGTAACTTTGNNNTGGCAGGAACCCCGCNNNNNNNNATAGACACGTACTTNNNC 60 



QY 
Db 



394 ACAGAGAGGTCTAGCACATACCGCTCCAAGGGCTTTGACGTCACAGTGAAGTACACACAA 453 

I I I I t I I I I I I I I t It I I I I I I t I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
61 ACAGAGAGGTCTAGCACATACCGCTCCAAGGGCTTTGACGTCACAGTGAAGTACACACAA 120 



Qy 

Db 



454 GGAAGCTGGACGGGCTTCGTTGGGGAAGACCTCGTCACCATCCCCAAAGGCTTCAATACT 513 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
121 GGAAGCTGGACGGGTTTCGTTGGGGAAGACTTCGTCACCATCCCCAAAGGCTTCAATACT 180 



Qy 

Db 



514 
181 



TCTTTTCTTGTCAACATTGCCACTATTTTTGAATCAGAGAATTTCTTTTTGCCTGGGATT 

I | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I 
TCTTTTCTTGTCAACATTGCCACTATTTTTGAATCAGAGAATTTCTTTTTGCCTGGGATT 



573 
240 



Qy 574 AAATGGAATGGAATAC TTGGCC TAGCTTATGCCACACTTGCCAAGC CATCAAGTTCTC TG 633 

I | | | | | | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 AAATGGAATGGAATACTTGGCCTAGCTTATGCCACACTTGCCAAGNNNNNNNNNNNNNNN 300 

Qy 634 GAGACCTTCTTCGACTCCCTGGTGACACAAGCAAACATCCCCAACGTTTTCTCCATGCAG 693 

Db 301 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN^ 360 

Qy 694 ATGTGTGGAGCCGGCTTGCCCGTTGCTGGATCTGGGACCAACGGAGGTAGTCTTGTCTTG 753 

I I I I I I 

Db 361 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNl^ 420 

Qy 754 GGTGGAATTGAACCAAGTTTGTATAAAGGAGACATCTGGTATACCCCTATTAAGGAAGAG 813 

I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 GGTGGAATTGAACCAAGTTTGTATAAAGGAGACATCTGGTATACCCCTATTAAGGAAGAG 480 

Qy 814 TGGTACTACCAGATAGAAATTCTGAAATTGGAAATTGGAGGCCAAAGCCTTAATCTGGAC 873 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 TGGTACTACCAGATAGAAATTCTGAAATTGGAAATTGGAGGCCAAAGCCTTAATCTGGAC 540 

Qy 874 TGCAGAGAGTATAACGCAGACAAGGCCATCGTGGACAGTGGCACCACGCTGCTGCGCCTG 933 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I Ml 
Db 541 TGCAGAGAGTATAACGCAGACAAGGCCATCGTGGACAGTGGCACCACGCTGCTGCGTCTG 600 

Qy 934 CCCCAGAAGGTGTTTGATGCGGTGGTGGAAGCTGTGGCCCGCGCATCTCTGATTCCAGAA 993 

I I I I M I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 CCCCAGAAGGTGTTTGATGCAGTGGTGGAAGCTGTGGCCCGCGCATCTCTGATTCCAGAA 660 

Qy 994 TTCTCTGATGGTTTCTGGACTGGGTCCCAGCTGGCGTGCTGGACGAATTCGGAAACACCT 1053 

I | | | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 TTCTCTGATGGTTTCTGGACTGGGTCCCAGCTGGCGTGCTGGACGAATTCGGAAACACCT 720 

Qy 1054 TGGTCTTACTTCCCTAAAATCTCCATCTACCTGAGAGATGAGAACTCCAGCAGGTCATTC 1113 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 TGGTCTTACTTCCCTAAAATCTCCATCTACCTGAGAGACGAGAACTCCAGCAGGTCATTC 780 

Qy 1114 CGTATCACAATCCTGCCTCAGCTTTACATTCAGCCCATGATGGGGGCCGGCCTGAATTAT 1173 

I | || | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I II I I I I I I I I I I I I I I I I I 
Db 781 CGTATCACAATCCTGCCTCAGCTTTACATTCAGCCCATGATGGGGGCCGGCCTGAATTAT 840 

Qy 1174 GAATGTTACCGATTCGGCATTTCCCCATCCACAAATGCGCTGGTGATCGGTGCCACGGTG 1233 

I | I I I I I I M I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 GAATGTTACCGATTCGGCATTTCCCCATCCACAAACGCGCTGGTGATCGGTGCCACGGTG 900 

Qy 1234 ATGGAGGGCTTCTACGTCATCTTCGACAGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGC 1293 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 901 ATGGAGGGCTTCTATGTCATCTTCGACAGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGC 960 

Qy 1294 CCCTGTGCAG 1303 

I I I I I I I I I I 
Db 961 CCCTGTGCAG 970 



RESULT 9 
BU179147 

LOCUS BU179147 908 bp mRNA linear EST 04-SEP-2002 

DEFINITION AGENCOURT 8050401 NIH MGC 112 Homo sapiens cDNA clone IMAGE : 6089176 



ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANI SM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



FEATURES 

source 



r 



5' , mRNA sequence. 
BU179147 

BU179147 .1 GI : 22693131 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 
1 (bases 1 to 908) 
NIH-MGC http : / /mgc . nci . nih . gov/ . 

National Institutes of Health, Mammalian Gene Collection (MGC) 
Unpublished (1999) 

Contact: Robert Strausberg, Ph.D. 

Email : cgapbs -r@mail . nih . gov 

Tissue Procurement: DCTD/DTP 
cDNA Library Preparation: Rubin Laboratory 
cDNA Library Arrayed by: The I.M.A.G.E. Consortium (LLNL) 
DNA Sequencing by: Agencourt Bioscience Corporation 
Clone distribution: MGC clone distribution information can be 

found through the I.M.A.G.E. Consortium/ LLNL at : 

http : / / image . llnl . gov 

Plate: LLCM2328 row: i column: 17 

High quality sequence stop: 673. 
Location/Qualifiers 
1. .908 

/organisms" Homo sapiens" 
/mol_type= " mRNA" 
/db_xref=" taxon: 9606" 
/clone=" IMAGE: 6089176" 

/tissue_type= "melanotic melanoma, cell line" 
/lab_Jiost= M DH10B (phage-resistant) " 
/clone_JLib="NIH_MGC_112" 

/note= 11 Organ: skin; Vector: pOTB7 ; Site_l: Xhol ; Site_2 : 
EcoRI; cDNA made by oligo-dT priming. Directionally cloned 
into EcoRl/XhoI sites using the following 5 f adaptor: 
GGCACGAG(G). Library constructed by Ling Hong in the 
laboratory of Gerald M. Rubin (University of California, 
Berkeley) using ZAP-cDNA synthesis kit (Stratagene) and 
Superscript II RT (Life Technologies) . Note: this is a 
NIH MGC Library." 



ORIGIN 



Query Match 



45.2%; Score 815.2; DB 13; Length 908; 
Best Local Similarity 97.9%; Pred. No. 2.3e-110; 
Matches 879; Conservative 0; Mismatches 13; Indels 



6 ; Gaps 



5; 



Qy 

Db 



424 GGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAAGAC 483 

I | | | | M | | | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I M I I I I I I I 
1 GGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAAGAC 60 



QY 
Db 



484 CTCGTCACCATCCCCAAAGGCTTCAATACTTCTTTTCTTGTCAACATTGCCACTATTTTT 543 

| | | I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I M M M I I I I I I I I I I 
61 CTCGTCACCATCCCCAAAGGCTTCAATACTTCTTTTCTTGTCAACATTGCCACTATTTTT 120 



Qy 

Db 



544 
121 



GAATCAGAGAATTTCTTTTTGCCTGGGATTAAATGGAATGGAATACTTGGCCTAGCTTAT 

I I I II I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I 
GAATCAGAGAATTTCTTTTTGCCTGGGATTAAATGGAATGGAATACTTGGCCTAGCTTAT 



603 
180 



Qy 


604 


GCCACACTTGCCAAGCCATCAAGTTCTCTGGAGACCTTCTTCGACTCCCTGGTGACACAA 


663 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 




Db 


181 


GCCACACTTGCCAAGCCATCAAGTTCTCTGGAGACCTTCTTCGACTCCCTGGTGACACAA 


240 


Qy 


664 

\J \J 


GCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCTGGA 


723 




It I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


241 


GCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCTGGA 


300 


Qy 




TCTGGGACCAACGGAGGTAGTCTTGTCTTGGGTGGAATTGAACCAAGTTTGTATAAAGGA 


783 




1 1 It 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 




Db 


301 


TCTGGGACCAACGGAGGTAGTCTTGTCTTGGGTGGAATTGAACCAAGTTTGTATAAAGGA 


360 


Qy 


/OH 


nArATCTGGTATACCCCTATTAAGGAAGAGTGGTACTACCAGATAGAAATTCTGAAATTG 


843 




1 1 1 1 It 1 11 1 1 t 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


361 


GACATCTGGTATACCCCTATTAAGGAAGAGTGGTACTACCAGATAGAAATTCTGAAATTG 


420 


Qy 


AAA 
o *» ** 


GAAATTGGAGGCCAAAGCCTTAATCTGGACTGCAGAGAGTATAACGCAGACAAGGCCATC 

W/UmTIm M» W W/\W ^7 W W^M^MtXW W W *M mW*JW>* mW mV WW*1W M» ^10 ^**Mi *W« Ml^rfM *W M* * *• M-^»» ^^M> «V* M^^M M^> — 


903 




1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 t 1 1 1 1 1 1 1 M 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


421 


GAAATTGGAGGCCAAAGCCTTAATCTGGACTGCAGAGAGTATAACGCAGACAAGGCCATC 


480 


Qy 


7Uft 


GTGGArAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTGGAA 


963 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 It 1 1 11 1 11 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


481 


GTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTGGAA 


540 


Qy 


Q&A 


arTRTnGrrrGPGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCCCAG 


1023 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 11 1 1 1 1 1 1 It 1 M 1 It 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


541 


GCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCCCAG 


600 


Qy 


1 no a 


rTfsrrprtTRPTGRArGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATCTAC 


1083 




II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 t 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 II 1 1 1 1 1 1 1 1 1 1 




Db 


601 


CTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATCTAC 


660 


Qy 




rTGAKAGATGAGAACTCCAGCAGGTCATTCCGTATCACAATCCTGCCTCAGCTTTACATT 


1143 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 It 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 




Db 


661 


CTGAGAGATGAGAACTCCAGCAGGTCATTCCGTATCACAATCCTGCCTCAGCTTTACATT 


720 


Qy 


1 1 44 

J. X "± 


CAGCCCATGATGGGGGCCGG-CCTGAATTATGAATGTTACCGATTCGGCATTTCCCCATC 


1202 




I I I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Dr> 




CAGCCCATGATGGGGGCCGGCCCTGAATTATGAATGTTACCGATTCGGCATTTCCCCATC 


780 


Qy 


1203 


CACAAATGC - GCTGGTGATCGGTGCCACGGT — GATGGAGGGCTTCTACGTCATCTTCGA 


1259 




I I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 




Db 


781 


CACAAATGC GGCTGGTGATCGGTGCCACGGTTGATGGAGGGCCTTCTACGTCATCTTCCA 


840 


Qy 


1260 


C AGAGC CC AGAAGAGGGT - GGGC TTC GC AGCGAG - C CC C TGTGC AGAAATTGC AGGTG 1315 




I I I I | 1 M 1 1 1 1 1 1 1 1 III III 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


841 


CAGACCCCAAAAGAGGGTGGGGTTTCCCAGCGAGCCCCCTGTGCAAAAATTGCAGGGG 898 



RESULT 10 

CA489608 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 



CA489608 912 bp mRNA linear EST 14-NOV-2002 

AGENCOURT_10810689 MAPcL Homo sapiens cDNA clone IMAGE : 6722086 5', 
mRNA sequence. 
CA489608 

CA489608 .1 GI : 24952399 



KEYWORDS EST . 

SOURCE Homo sapiens (human) 

ORGANISM Homo sapiens 

Eukaryota; Metazoa; Chorda ta; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Primates; Catarrhini ; Hominidae; Homo. 
REFERENCE 1 (bases 1 to 912) 

AUTHORS NIH-MGC h t tp : / /mgc . nci . nih . gov/ . 

TITLE National Institutes of Health, Mammalian Gene Collection (MGC) 

JOURNAL Unpublished (1999) 
COMMENT Contact: Robert Strausberg, Ph.D. 

Email : cgapbs-r@mail . nih . gov 

Tissue Procurement: Kristi A. Egland, Ira Pastan 
cDNA Library Preparation: Invitrogen Corp 

cDNA Library Arrayed by: The I.M.A.G.E. Consortium (LLNL) 
DNA Sequencing by: Agencourt Bioscience Corporation 
Clone distribution: MGC clone distribution information can be 
found through the I.M.A.G.E. Consortium/ LLNL at : 
http : / / image . llnl . gov 
Plate: LLAM14284 row: d column: 22 
High quality sequence stop: 663. 
FEATURES Location/Qualif iers 

source 1. .912 

/ organ ism= 11 Homo sapiens" 
/mol_type= M mRNA" 
/db_xref=" taxon: 9606" 
/clone=" IMAGE: 6722086" 

/cell_line="ZR-75-l / MCF7 , SK-BR-3, MDA-MB-231, 
hTERT-HMEl , LNCaP" 
/ 1 ab_ho s t = " EMDH 1 OB " 
/ cl one_l ib= " MAPcL " 

/note=" Vector: pCMV-SPORT6; SiteJL: EcoRV; Site_2: Not I; 
Subtracted with brain, liver, lung, kidney and muscle. 
Directionally cloned. Priming method: oligo-dT. Average 
insert size: 1800 bp. Library amplification: 26,000 fold. 
Kristi A. Egland, James J. Vincent, Robert Strausberg, 
Bungkook Lee & Ira Pastan: Discovery of new breast 
cancer genes encoding membrane and secreted proteins . 
Manuscript submitted. " 

ORIGIN 

Query Match 44.4%; Score 800.6; DB 14; Length 912; 

Best Local Similarity 97.5%; Pred. No. 3.2e-108; 

Matches 857; Conservative 0; Mismatches 14; Indels 8; Gaps 4; 



Qy 440 TGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAAGACCTCGTCACCATCCCCA 499 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 TGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAAGACCTCGTCACCATCCCCA 60 

Qy 500 AAGGCTTCAATACTTCTTTTCTTGTCAACATTGCCACTATTTTTGAATCAGAGAATTTCT 559 

I I I I I I I I I I I I I I I I 11 I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 61 AAGGCTTCAATACTTCTTTTCTTGTCAACATTGCCACTATTTTTGAATCAGAGAATTTCT 120 

Qy 560 TTTTGCCTGGGATTAAATGGAATGGAATACTTGGCCTAGCTTATGCCACACTTGCCAAGC 619 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 TTTTGCC TGGGATTAAATGGAATGGAATAC TTGGCCTAGCTTATGCCAC ACTTGCCAAGC 180 



Qy 



620 CATCAAGTTCTCTGGAGACCTTCTTCGACTCCCTGGTGACACAAGCAAACATCCCCAACG 679 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 

Db 181 CATCAAGTTCTCTGGAGACCTTCTTCGACTCCCTGGTGACACAAGCAAACATCCCCAACG 240 

Qy 680 TTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCTGGATCTGGGACCAACGGAG 739 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I 

Db 241 TTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCTGGATCTGGGACCAACGGAG 300 

Qy 740 GTAGTCTTGTCTTGGGTGGAATTGAACCAAGTTTGTATAAAGGAGACATCTGGTATACCC 799 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 GTAGTCTTGTCTTGGGTGGAATTGAACCAAGTTTGTATAAAGGAGACATCTGGTATACCC 360 

Qy 800 CTATTAAGGAAGAGTGGTACTACCAGATAGAAATTCTGAAATTGGAAATTGGAGGCCAAA 859 

I I I I I I I M I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I 
Db 361 CTATTAAGGAAGAGTGGTACTACCAGATAGAAATTCTGAAATTGGAAATTGGAGGCCAAA 420 

Qy 860 GCCTTAATCTGGACTGCAGAGAGTATAACGCAGACAAGGCCATCGTGGACAGTGGCACCA 919 

I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 GCCTTAATCTGGACTGCAGAGAGTATAACGCAGACAAGGCCATCGTGGACAGTGGCACCA 480 

Qy 920 CGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTGGAAGCTGTGGCCCGCGCAT 979 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 481 CGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTGGAAGCTGTGGCCCGCGCAT 540 

Qy 980 CTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCCCAGCTGGCGTGCTGGACGA 1039 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 CTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCCCAGCTGGCGTGCTGGACGA 600 

Qy 1040 ATTCGGAAAC ACCTTGGTCTTAC TTCCCTAAAATCTC C ATCTACCTGAGAGATGAGAACT 1099 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 ATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATCTACCTGAGAGATGAGAACT 660 

Qy 1100 CCAGCAGGTCATTCCGTATCACAATCCTGCCTCAGCTTTACATTCAGCCCATGATGGGGG 1159 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I 1 I 
Db 661 CCAGCAGGTCATTCCGTATCACAATCCTGCCTCAGCTTTACATTCAGCCCATGATGGGGG 720 

Qy 1160 CCGGCCTGAATTATGAATGTTACCGATTCGGCATTTCCCCATCCAC-AAATGCGCTGGTG 1218 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 CCGGCCTGAATTATGAATGTTACCGATTCGGCATTTCCCCATCCACAAAATGCGCTGGTG 780 

Qy 1219 ATCGGTGC CACGGTGATGGAGGGCTTCTACGTCATCTTCGACAGAGCCCAGA AG 1272 

I I I I II I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 781 ATCGGTGCCCACGGTGAATGGGAGGGCTTCTACGTCATCTTCGACAGAGCCCAAAAAGAA 840 

Qy 1273 AGGGTGGGCTTCGCAGCG-AGCCCCTGTGCAGAAATTGC 1310 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
Db 841 GGGTGGGGCTTCGCAGCGAACCCCCTGTGCAGAAAATGC 879 



RESULT 11 

BQ945383 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 



BQ945383 968 bp mRNA linear EST 21-AUG-2002 

AGENCOURT_10030827 NIH_MGC_40 Homo sapiens cDNA clone IMAGE: 6481468 
5' , mRNA sequence. 
BQ945383 

BQ945383 .1 GI : 22360861 
EST. 

Homo sapiens (human) 



ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



FEATURES 

source 



Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 

Mammalia ; Eutheria ; Primates ; Catarrhini ; Hominidae ; Homo . 

1 (bases 1 to 968) 

NIH-MGC http://mgc.nci.nih.gov/. 

National Institutes of Health, Mammalian Gene Collection (MGC) 
Unpublished (1999) 

Contact: Robert Strausberg, Ph.D. 

Email : cgapbs -r@mail . nih . gov 

Tissue Procurement: DCTD/DTP 
cDNA Library Preparation: Rubin Laboratory 
cDNA Library Arrayed by: The I.M.A.G.E. Consortium (LLNL) 
DNA Sequencing by: Agencourt Bioscience Corporation 
Clone distribution: MGC clone distribution information can be 

found through the I.M.A.G.E. Consortium/ LLNL at: 

http : / / image . llnl . gov 

Plate: LLCM2662 row: o column: 05 

High quality sequence start: 26 

High quality sequence stop: 689. 
Location/ Qualifiers 
1. .968 

/ organism=" Homo sapiens 11 
/mol_type=" mRNA" 
/db_xref=="taxon: 9606" 
/clone=" IMAGE: 6481468" 
/tissue_type=" carcinoma, cell line" 
/lab_host="DHlOB (phage -resistant) " 
/clone_lib="NIH_MGC_40 " 

/note-"Organ: prostate; Vector: pOTB7 ; Site_l: Xhol; 
Site_2: EcoRI ; cDNA made by oligo-dT priming. 
Directionally cloned into EcoRI /Xhol sites using the 
following 5 ! adaptor: GGCACGAG (G) . Library constructed by 
Ling Hong in the laboratory of Gerald M. Rubin (University 
of California, Berkeley) using ZAP-cDNA synthesis kit 
(Stratagene) and Superscript II RT (Life Technologies) . 
Note: this is a NIH MGC Library." 



ORIGIN 



Query Match 



44.3%; Score 798.8; DB 13; Length 968; 



Best Local Similarity 97.6%; 
Matches 853 ; Conservative 



Pred. No. 5.7e-108; 
0 ; Mismatches 17 ; 



Indels 



4 ; Gaps 



4; 



Qy 

Db 



5 3 TGCGCGCCGCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGG 112 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1 TTCAAGACGAGGCTGAGCTGGCCCCCGCTCACTTCACGCTGCCCCTCCGGGTGGCCGCGG 60 



Qy 

Db 



113 CCACGAACCGCGTAGTTGCGCCCACCCCGGGACCCGGG-ACCCCTGCCGAGCGCCACGCC 171 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
61 CCACGAACCGCGTAGTTGCGCCCACCCCGGGACCCGGGTGCCCCTGCCGAGCGCCACGCC 120 



Qy 

Db 



172 GACGGCTTGGCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTC 231 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
121 GACGGCTTGGCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTC 180 



Qy 232 TTGGCCATGGTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTG 291 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 TTGGCCATGGTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTG 240 



Qy 292 ATCGGGACCCCCC CGCAGAAGCTACAGATTCTCGTTGAC ACTGGAAGCAGTAAC TTTGC C 351 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 
Db 241 ATCGGGACCCCCCCGCAGAAGCTACAGATTCTCGTTGACACTGGAAGCAGTAACTTTGCC 300 

Qy 352 GTGGCAGGAACCCCGCACTCCTACATAGACACGTACTTTGACACAGAGAGGTCTAGCACA 411 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 GTGGCAGGAACCCCGCACTCCTACATAGACACGTACTTTGACACAGAGAGGTCTAGCACA 360 

Qy 412 TACCGCTCCAAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTC 471 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 TACCGCTCCAAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTC 420 

Qy 472 GTTGGGGAAGACCTCGTCACCATCCCCAAAGGCTTCAATACTTCTTTTCTTGTCAACATT 531 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 GTTGGGGAAGACCTCGTCACCATCCCCAAAGGCTTCAATACTTCTTTTCTTGTCAACATT 480 

Qy 532 GCCACTATTTTTGAATCAGAGAATTTCTTTTTGCCTGGGATTAAATGGAATGGAATACTT 591 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 GCCACTATTTTTGAATCAGAGAATTTCTTTTTGCCTGGGATTAAATGGAATGGAATACTT 540 

Qy 592 GGCCTAGCTTATGCCACACTTGCCAAGCCATCAAGTTCTCTGGAGACCTTCTTCGACTCC 651 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 541 GGCCTAGCTTATGCCACACTTGCCAAGCCATCAAGTTCTCTGGAGACCTTCTTCGACTCC 600 

Qy 652 CTGGTGACACAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTG 711 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 CTGGTGACACAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTG 660 

Qy 712 CCCGTTGCTGGATCTGGGACCAACGGAGGTAGTCTTGTCTTGGGTGGAATTGAACCAAGT 771 

I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 661 CCCGTTGCTGGATCTGGGACCAACGGAGGTAGTCTTGTCTTGGGTGGAATTGAACCAAGT 720 

Qy 772 TTGTATAAAGGAGACATCTGGTATA-CCCCTATTAAGGAAGAGTGGTACTACCAGATAGA 830 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 721 TTGTATAAAGGAGACATCTGGTATACCCCCTATTAAGGAAGAGTGGTACTACCAGATAGA 780 

Qy 831 AATTCTGAAATTGGAAATT - GGAGGCCAAAGCCTTAATCTGGACTGC AGAGAGTATAA- C 888 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 781 AATTCTGGAATTGGAAATTGGGAGCCCAAAGCCTTAATCTGGACTGCAGAGAGTATAACC 840 

Qy 889 GCAGACAAGGCCATCGTGGACAGTGGCACCACGC 922 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 GCAGACAAGCCATCCGTGGACAGTGGCACCACGC 874 



RESULT 12 

CA454208 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



CA454208 890 bp mRNA linear EST 12-NOV-2002 

AGENCOURT_10738679 MAPcL Homo sapiens cDNA clone IMAGE : 6718872 5 1 , 
mRNA sequence. 
CA454208 

CA454208 .1 GI : 24903721 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebra ta; Euteleostomi ; 



Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 
REFERENCE 1 (bases 1 to 890) 

AUTHORS NIH-MGC http : //mgc . nci . nih . gov/ . 

TITLE National Institutes of Health, Mammalian Gene Collection (MGC) 

JOURNAL Unpublished (1999) 
COMMENT Contact: Robert Strausberg, Ph.D. 

Email : cgapbs-r@mail . nih . gov 

Tissue Procurement: Kristi A. Egland, Ira Pas tan 
cDNA Library Preparation: Invitrogen Corp 

cDNA Library Arrayed by: The I.M.A.G.E. Consortium (LLNL) 

DNA Sequencing by: Agencourt Bioscience Corporation 

Clone distribution: MGC clone distribution information can be 

found through the I.M.A.G.E. Consortium/ LLNL at : 

http : // image . llnl . gov 

Plate: LLAM14275 row: n column: 24 
High quality sequence stop: 651. 
FEATURES Location/Qualif iers 

source 1. .890 

/organism= ,f Homo sapiens 11 
/mol_type= " mRNA" 
/ db_xref = " taxon : 9 6 0 6 " 
/ cl one= " IMAGE :6718872" 

/cell_line="ZR-75-l, MCF7 , SK-BR-3, MDA-MB-231, 
hTERT-HMEl , LNCaP" 
/lab_host="EMDH10B" 
/ cl one_l ib= 11 MAPcL " 

/note=" Vector: pCMV-SPORT6 ; Site_l: EcoRV; Site_2 : Not I; 
Subtracted with brain, liver, lung, kidney and muscle. 
Directionally cloned. Priming method: oligo-dT. Average 
insert size: 1800 bp. Library amplification: 26,000 fold. 
Kristi A. Egland, James J. Vincent, Robert Strausberg, 
Bungkook Lee & Ira Pastan: Discovery of new breast 
cancer genes encoding membrane and secreted proteins . 
Manuscript submitted. " 

ORIGIN 

Query Match 43.9%; Score 792.4; DB 14; Length 890; 

Best Local Similarity 97.9%; Pred. No. 5.1e-107; 

Matches 856; Conservative 0; Mismatches 11; Indels 7; Gaps 5; 



Qy 704 CCGGCTTGCCCGTTGCTGGATCTGGGACCAACGGAGGTAGTCTTGTCTTGGGTGGAATTG 763 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 CCGGCTTGCCCGTTGCTGGATCTGGGACCAACGGAGGTAGTCTTGTCTTGGGTGGAATTG 60 

Qy 764 AACCAAGTTTGTATAAAGGAGACATCTGGTATACCCCTATTAAGGAAGAGTGGTACTACC 823 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 AACCAAGTTTGTATAAAGGAGACATCTGGTATACCCCTATTAAGGAAGAGTGGTACTACC 120 

Qy 824 AGATAGAAATTCTGAAATTGGAAATTGGAGGCCAAAGCCTTAATCTGGACTGCAGAGAGT 883 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 AGATAGAAATTCTGAAATTGGAAATTGGAGGCCAAAGCCTTAATCTGGACTGCAGAGAGT 180 

Qy 884 ATAACGCAGACAAGGCCATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGG 943 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 ATAACGCAGACAAGGCCATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGG 240 

Qy 944 TGTTTGATGCGGTGGTGGAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATG 1003 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 241 TGTTTGATGCGGTGGTGGAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATG 300 

Qy 1004 GTTTCTGGACTGGGTCCCAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACT 1063 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 GTTTCTGGACTGGGTCCCAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACT 360 

Qy 1064 TCCCTAAAATCTCCATCTACC TGAGAGATGAGAAC TCCAGCAGGTC ATTC CGTATC ACAA 1123 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 
Db 361 TCCCTAAAATCTCCATCTACCTGAGAGATGAGAACTCCAGCAGGTCATTCCGTATCACAA 420 

Qy 1124 TCCTGCCTCAGCTTTACATTCAGCCCATGATGGGGGCCGGCCTGAATTATGAATGTTACC 1183 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 TCCTGCCTCAGCTTTACATTCAGCCCATGATGGGGGCCGGCCTGAATTATGAATGTTACC 480 

Qy 1184 GATTCGGCATTTCCCCATCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCT 1243 

I | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 GATTCGGCATTTCCCCATCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCT 540 

Qy 1244 TCTACGTCATCTTCGACAGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAG 1303 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 TCTACGTCATCTTCGACAGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAG 600 

Qy 1304 AAATTGC AGGTGC TGC AGTGTCTGAAATTTCCGGGCC TTTCTCAAC AGAGGATGTAGCCA 1363 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 AAATTGCAGGTGCTGCAGTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCA 660 

Qy 1364 GCAACTGTGTCCCCGCTCAGTCTTTGAGCGAGCCCA-TTTTGTGGATTGTGTCCTATGCG 1422 

I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 GCAACTGTGTCCCCGCTCAGTCTTTGAGCGAGCCCATTTTTGTGGATTGTGTCCTATGCG 720 

Qy 1423 CTCATGAGCGTCTGTGGAGCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTT- 1481 

I | | | | | II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 
Db 721 CTCATGAGCGTCTGTGGAGCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCCTTC 780 

Qy 1482 CCGGTGTCAGCGTCGCCCCC — GTGACCCTGAGGTCGTCAATGATG-AGTCCTCTCTGGT 1538 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 781 CCGGTGTCAGCGTCGCCCCCCGTGACCCCTGAGGTCGTCAATGATGAAGTCCTCTCTGGT 840 

Qy 1539 CAGACAT — CGCTGGAAATGAATAGCCAGGCCTG 1570 

I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 841 CAGACATTCGCTGGAAAATTAATAGCCAGGCCTG 874 



RESULT 13 

CA488936 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 



CA488936 902 bp mRNA linear EST 14-NOV-2002 

AGENCOURT_10 808280 MAPcL Homo sapiens cDNA clone IMAGE : 6721142 5', 
mRNA sequence. 
CA488936 

CA488936.1 GI: 24951727 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebra ta; Euteleostomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 
1 (bases 1 to 902) 



AUTHORS 
TITLE 
JOURNAL 
COMMENT 



FEATURES 

source 



NIH-MGC http://mgc.nci.nih.gov/. 

National Institutes of Health, Mammalian Gene Collection (MGC) 

Unpublished (1999) 

Contact: Robert Strausberg, Ph.D. 

Email : cgapbs -r@mail . nih . gov 

Tissue Procurement: Kristi A. Egland, Ira Pastan 
cDNA Library Preparation: Invitrogen Corp 

cDNA Library Arrayed by: The I.M.A.G.E. Consortium (LLNL) 
DNA Sequencing by: Agencourt Bioscience Corporation 
Clone distribution: MGC clone distribution information can be 
found through the I.M.A.G.E. Consortium/ LLNL at: 
http://image.llnl.gov 
Plate: LLAM14281 row: m column: 14 
High quality sequence stop: 596. 
Location/Qualifiers 
1. .902 

/organism= n Homo sapiens" 
/mo l_type= " mRNA" 
/ db_xref = " taxon : 9 6 0 6 " 
/ cl one= " IMAGE : 6721142" 

/cell_line="ZR-75-l, MCF7 , SK-BR-3, MDA-MB-231, 
hTERT-HMEl , LNCaP" 
/lab_host="EMDH10B" 
/ cl one_l ib= " MAPcL " 

/note=" Vector: pCMV-SPORT6; Site_l: EcoRV; Site_2 : Not I; 
Subtracted with brain, liver, lung, kidney and muscle. 
Directionally cloned. Priming method: oligo-dT. Average 
insert size: 1800 bp. Library amplification: 26,000 fold. 
Kristi A. Egland, James J. Vincent, Robert Strausberg, 
Bungkook Lee & Ira Pastan: Discovery of new breast 
cancer genes encoding membrane and secreted proteins . 
Manuscript submitted." 



ORIGIN 



Query Match 43.5%; Score 785.2; DB 14; Length 902; 

Best Local Similarity 98.9%; Pred. No. 5.8e-106; 

Matches 801; Conservative 0; Mismatches 8; Indels 1; 



Gaps 



i; 



Qy 

Db 



680 TTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCTGGATCTGGGACCAACGGAG 739 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I ! I I I I I 
1 TTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCTGGATCTGGGACCAACGGAG 60 



Db 



740 GTAGTCTTGTCTTGGGTGGAATTGAACCAAGTTTGTATAAAGGAGACATCTGGTATACCC 799 

I I I I I I I I I II I I I I I I I I I I i I II I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I 
61 GTAGTCTTGTCTTGGGTGGAATTGAACCAAGTTTGTATAAAGGAGACATCTGGTATACCC 120 



Db 

Qy 

Db 



800 CTATTAAGGAAGAGTGGTACTACCAGATAGAAATTCTGAAATTGGAAATTGGAGGCCAAA 859 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
121 CTATTAAGGAAGAGTGGTACTACCAGATAGAAATTCTGAAATTGGAAATTGGAGGCCAAA 180 

860 GCCTTAATCTGGACTGCAGAGAGTATAACGCAGACAAGGCCATCGTGGACAGTGGCACCA 919 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
181 GCCTTAATCTGGACTGCAGAGAGTATAACGCAGACAAGGCCATCGTGGACAGTGGCACCA 240 



Qy 920 
Db 241 



CGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTGGAAGCTGTGGCCCGCGCAT 979 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
CGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTGGAAGCTGTGGCCCGCGCAT 300 



Qy 980 CTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCCCAGCTGGCGTGCTGGACGA 1039 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 CTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCCCAGCTGGCGTGCTGGACGA 360 

Qy 1040 ATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATCTACCTGAGAGATGAGAACT 1099 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 ATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATCTACCTGAGAGACGAGAACT 420 

Qy 1100 CCAGCAGGTCATTCCGTATCACAATCCTGCCTCAGCTTTACATTCAGCCCATGATGGGGG 1159 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I f I I I I I I I I I I I I I I I I I I I 
Db 421 CCAGCAGGTCATTCCGTATCACAATCCTGCCTCAGCTTTACATTCAGCCCATGATGGGGG 480 

Qy 1160 CCGGCCTGAATTATGAATGTTACCGATTCGGCATTTCCCCATCCACAAATGCGCTGGTGA 1219 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 11 I I I I I I I ! I I I I I I I I I I I I I I I I I I I 
Db 481 CCGGCCTGAATTATGAATGTTACCGATTCGGCATTTCCCCATCCACAAATGCGCTGGTGA 540 

Qy 1220 TCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGACAGAGCCCAGAAGAGGGTGG 1279 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 TCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGACAGAGCCCAGAAGAGGGTGG 600 

Qy 1280 GCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCAGTGTCTGAAATTTCCGGGC 1339 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II II I I I I I I I I I I I I 
Db 601 GCTTCGCAGCGAGCCCCTGTGCAGAAATTGCACGTGCTGCAGTGTCTGAAATTTCCGGGC 660 

Qy 1340 CTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCTCAGTCTTTGAGCGAGCCCA 1399 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 CTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCTCAGTCTTTGAGCGAGCCCA 720 

Qy 1400 -TTTTGTGGATTGTGTCCTATGCGCTCATGAGCGTCTGTGGAGCCATCCTCCTTGTCTTA 1458 

I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 TTTTTGTGGATTGTGTCCTATGCGCTCATGAGCGTCTGTGGAGCCATCCTCCTTGTCTTA 780 

Qy 1459 ATCGTCCTGCTGCTGCTGCCGTTCCGGTGT 1488 

I I I I I I I I I I I I I I I I II I I I I II 
Db 781 ATCGTCCTGCTGCTGCTGGCCGTTCCGGGT 810 



RESULT 14 

CA487940 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



CA487940 836 bp mRNA linear EST 14-NOV-2002 

AGENCOURT_108 10992 MAPcL Homo sapiens cDNA clone IMAGE : 6719667 5', 
mRNA sequence . 
CA487940 

CA487940 .1 GI : 24948478 
EST. 

Homo s api ens ( human ) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Crania ta; Vertebra ta; Euteleostomi ; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae ; Homo. 

1 (bases 1 to 836) 

NIH-MGC http : / / mgc . nci . nih . gov/ . 

National Institutes of Health, Mammalian Gene Collection (MGC) 
Unpublished (1999) 

Contact: Robert Strausberg, Ph.D. 
Email: cgapbs-r@mail.nih.gov 

Tissue Procurement: Kristi A. Egland, Ira Pas tan 



cDNA Library Preparation: Invitrogen Corp 

cDNA Library Arrayed by: The I.M.A.G.E. Consortium (LLNL) 

DNA Sequencing by: Agencourt Bioscience Corporation 

Clone distribution: MGC clone distribution information can be 

found through the I.M.A.G.E. Consortium/ LLNL at: 

http : / / image . llnl . gov 

Plate: LLAM14277 row: p column: 03 
High quality sequence stop: 629. 
FEATURES Location/Qualifiers 
source 1. .836 

/organism="Homo sapiens" 
/mol_type="mRNA ,f 
/dbjcref = n taxon : 9606" 
/clone=" IMAGE: 6719667" 

/cell_line="ZR-75-l / MCF7 , SK-BR-3 , MDA-MB-231 , 
hTERT-HMEl , LNCaP" 
/ 1 ab_ho s t= " EMDH 1 OB " 
/ cl one__l ib= " MAPcL " 

/note=" Vector: pCMV-SPORT6 ; Site_l : EcoRV; Site_2 : Not I; 
Subtracted with brain, liver, lung, kidney and muscle. 
Directionally cloned. Priming method: oligo-dT, Average 
insert size: 1800 bp. Library amplification: 26,000 fold. 
Kristi A. Egland, James J. Vincent, Robert Strausberg, 
Bungkook Lee & Ira Pastan: Discovery of new breast 
cancer genes encoding membrane and secreted proteins . 
Manuscript submitted." 

ORIGIN 

Query Match 43.1%; Score 777.4; DB 14; Length 836; 

Best Local Similarity 98.2%; Pred. No. 8.4e-105; 

Matches 818; Conservative 0; Mismatches 11; Indels 4; Gaps 3; 

Qy 468 CTTCGTTGGGGAAGACCTCGTCACCATCCCCAAAGGCTTCAATACTTCTTTTCTTGTCAA 527 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 CTTCGTTGGGGAAGACCTCGTCACCATCCCCAAAGGCTTCAATACTTCTTTTCTTGTCAA 60 

Qy 528 CATTGCCACTATTTTTGAATCAGAGAATTTCTTTTTGCCTGGGATTAAATGGAATGGAAT 587 

I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 CATTGCCACTATTTTTGAATCAGAGAATTTCTTTTTGCCTGGGATTAAATGGAATGGAAT 120 

Qy 588 ACTTGGCCTAGCTTATGCCACACTTGCCAAGCCATCAAGTTCTCTGGAGACCTTCTTCGA 647 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I M I I I I t I I I I I I I I I I I I I I I I I 
Db 121 ACTTGGCCTAGCTTATGCCACACTTGCCAAGCCATCAAGTTCTCTGGAGACCTTCTTCGA 180 

Qy 648 CTCCCTGGTGACACAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGG 707 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I t I I I I I I I 
Db 181 CTCCCTGGTGACACAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGG 240 

Qy 708 CTTGCCCGTTGCTGGATCTGGGACCAACGGAGGTAGTCTTGTCTTGGGTGGAATTGAACC 767 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 CTTGCCCGTTGCTGGATCTGGGACCAACGGAGGTAGTCTTGTCTTGGGTGGAATTGAACC 300 

Qy 768 AAGTTTGTATAAAGGAGACATCTGGTATACCCCTATTAAGGAAGAGTGGTACTACCAGAT 827 

I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 AAGTTTGTATAAAGGAGACATCTGGTATACCCCTATTAAGGAAGAGTGGTACTACCAGAT 360 



Qy 



828 



AGAAATTCTGAAATTGGAAATTGGAGGCCAAAGCCTTAATCTGGACTGCAGAGAGTATAA 887 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 361 AGAAATTC TGAAATTGGAAATTGGAGGCCAAAGCCTTAATCTGGAC TGCAGAGAGTATAA 420 

Qy 888 CGCAGACAAGGCCATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTT 947 

I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I 
Db 421 CGCAGACAAGGCCATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTT 480 

Qy 948 TGATGCGGTGGTGGAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTT 1007 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 481 TGATGCGGTGGTGGAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTT 540 

Qy 1008 CTGGACTGGGTCCCAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCC 1067 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 541 CTGGACTGGGTCCCAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCC 600 

Qy 1068 TAAAATCTCCATCTACCTGAGAGATGAGAACTCCAGCAGGTCATTCCGTATCACAATCCT 1127 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 TAAAATCTCCATCTACCTGAGAGACGAGAACTCCAGCAGGTCATTCCGTATCACAATCCT 660 

Qy 1128 GCCTCAGCTTTACATTCAGCCCATGATGGGGGCCGGCCTGAATTATGAATGTTA-CCGAT 1186 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 661 GCCTCAGCTTTACATTCAGCCCATGATGGGGGCCGGCCTGAATTATGAATGTTACCCGAT 720 

Qy 1187 TCGGCATTTCCCCATCCACAAATGCGCTGGTGATCGGTGCCA-CGGTGATGGAGGGCTTC 1245 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II 
Db 721 TCGGCATTTCCCCCATCACAAATGCGCTGGTGATCGGTGCCACCGTTGATGGAGGGCTTC 780 

Qy 1246 TACGTCATCTTCGACAGAGCCCAGAA — GAGGGTGGGCTTCGCAGCGAGCCCC 1296 

I I I I I I I I I I I I I I I I I I I I I I III II I I I I I I I I I I I I I I I I I I 

Db 781 TACGTCATCTTCGACAGAGCCCCGAAAGAGGGTGGGGCTTCGCAACGAGCCCC 833 



RESULT 15 

BG281374 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



BG281374 843 bp mRNA linear EST 21-FEB-2001 

602401870F1 NIH_MGC_20 Homo sapiens cDNA clone IMAGE : 4544392 5', 
mRNA sequence. 
BG281374 

BG281374 .1 GI : 13030299 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa ; Chorda ta; Craniata ; Vertebra ta; Euteleostomi ; 

Mammalia; Eutheria; Primates; Catarrhini ; Hominidae; Homo. 

1 (bases 1 to 843) 

NIH-MGC http : / / mgc . nci . nih . gov/ . 

National Institutes of Health, Mammalian Gene Collection (MGC) 
Unpublished (1999) 

Contact: Robert Strausberg, Ph.D. 

Emai 1 : cgapbs - r @ mai 1 . nih . gov 

Tissue Procurement: ATCC/DCTD/DTP 
cDNA Library Preparation: Ling Hong/Rubin Laboratory 
cDNA Library Arrayed by: The I.M.A.G.E. Consortium (LLNL) 
DNA Sequencing by: Incyte Genomics, Inc. 

Clone distribution: MGC clone distribution information can be 
found through the I.M.A.G.E. Consortium/ LLNL at : image . llnl . gov 
Plate: LLCM1227 row: k column: 17 



High quality sequence stop: 818. 
FEATURES Location/Qualifiers 
source 1. .843 

/ organism=" Homo sapiens " 
/mol_type= " mRNA" 
/db_xref =" taxon : 9606" 
/clone-" IMAGE: 4544392" 
/tissue_type=" melanotic melanoma" 
/lab_host="DH10B (phage-resistant) " 
/ clone_lib= " NIH_MGC_2 0 " 

/note="Organ: skin; Vector: pOTB7; Site_l: Xhol ; Site_2: 
EcoRI ; cDNA made by oligo-dT priming. Directionally 
cloned into EcoRI /Xhol sites using the following 5 1 
adaptor: GGCACGAG (G) . Size-selected >500bp for average 
insert size 1.8kb. Library constructed by Ling Hong in 
the laboratory of Gerald M. Rubin (University of 
California/ Berkeley) using ZAP-cDNA synthesis kit 
(Stratagene) and Superscript II RT (Life Technologies) . " 

ORIGIN 

Query Match 43.1%; Score 777.4; DB 12; Length 843; 

Best Local Similarity 97.7%; Pred. No. 8.3e-105; 

Matches 820; Conservative 0; Mismatches 16; Indels 3; Gaps 3; 



Qy 765 ACCAAGTTTGTATAAAGGAGACATCTGGTATACCCCTATTAAGGAAGAGTGGTACTACCA 824 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 6 AACCAAGTTGTATAAAGGAGACATCTGGTATACCCCTATTAAGGAAGAGTGGTACTACCA 65 

Qy 825 GATAGAAATTCTGAAATTGGAAATTGGAGGCCAAAGCCTTAATCTGGACTGCAGAGAGTA 884 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 66 GATAGAAATTCTGAAATTGGAAA-TGGAGGCCAAAGCCTTAATCTGGACTGCAGAGAGTA 124 

Qy 885 TAACGCAGACAAGGCCATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGT 944 

I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 125 TAACGCAGACAAGGCCATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGT 184 

Qy 945 GTTTGATGCGGTGGTGGAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGG 1004 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 185 GTTTGATGCGGTGGTGGAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGG 244 

Qy 1005 TTTCTGGACTGGGTCCCAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTT 1064 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 245 TTTCTGGACTGGGTCCCAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTT 304 

Qy 1065 CCC TAAAATCTCCATCTACCTGAGAGATGAGAAC TCCAGCAGGTC ATTCCGTATCACAAT 1124 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 305 CCCTAAAATCTCCATCTACCTGAGAGACGAGAACTCCAGCAGGTCATTCCGTATCACAAT 364 

Qy 1125 CCTGCCTCAGCTTTACATTCAGCCCATGATGGGGGCCGGCCTGAATTATGAATGTTACCG 1184 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 365 CCTGCCTCAGCTTTACATTCAGCCCATGATGGGGGCCGGCCTGAATTATGAATGTTACCG 424 

Qy 1185 ATTCGGCATTTCCCCATCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTT 1244 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 425 ATTCGGCATTTCCCCATCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTT 484 



QY 



1245 CTACGTCATCTTCGACAGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGA 1304 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 485 CTACGTCATCTTCGACAGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGA 544 

Qy 1305 AATTGCAGGTGCTGCAGTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAG 1364 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 545 AATTGCAGGTGCTGCAGTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAG 604 

Qy 1365 CAACTGTGTCCCCGCTCAGTCTTTGAGCGAGCCCATTTTGTGGATTGTGTCCTATGCGCT 1424 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 605 CAACTGTGTCCCCGCTCAGTCTTTGAGCGAGCCCATTTTGTGGATTGTGTCCTATGCGCT 664 

Qy 1425 CATGAGCGTCTGTGGAGCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCG 1484 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 665 CATGAGCGTCTGTGGAGCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCG 724 

Qy 1485 GTGTCAGCGTCGCCCCCGTGACCCTGAGGTCGTCAATGATGAGTCCTCTCTGGTCAGACA 1544 

I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 725 GTGTCAGCGTCGCCCCCGTGA-CCTGAGGTCGTCAATGATGAGTCCTCTCTGGTCAGACA 783 

Qy 1545 TCGCTGGAAATGAATAGC CAGGCC TGACCTCAAGCAACCATGAACTCAGCTATTAAGAA 1603 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 784 TCGTGGAAAATGAATAGCCAGG - CTGAACTCAAGCAAAC ATGAACTCAGTATTAGAAAA 841 



Search completed: February 28, 2004, 07:03:45 
Job time : 4288 sees 



GenCore version 5.1.6 
Copyright (c) 1993 - 2004 Compugen Ltd. 



OM nucleic - nucleic search, using sw model 



Run on: 



February 28, 2004, 02:43:37 ; Search time 6893 Seconds 

(without alignments) 
11343.513 Million cell updates/sec 



Title: 

Perfect score: 
Sequence : 



US-09-668-314C-1 
1804 

1 atgggcgcactggcccgggc 



aaaccaaaaaaaaaaaaaaa 1804 



Scoring table: I DENT I T Y_NUC 

Gapop 10.0 , Gapext 1.0 



Searched 



3470272 seqs, 21671516995 residues 



Total number of hits satisfying chosen parameters: 



6940544 



Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 

Post-processing: Minimum Match 0% 

Maximum Match 100% 
Listing first 45 summaries 



Database : 



GenEmbl : * 



1 
2 
3 
4 
5 
6 
7 
8 
9 
10 
11 
12 
13 
14 
15 
16 
17 
18 
19 
20 
21 
22 
23 
24 
25 
26 
27 



gb_ba : * 
gb_htg : * 
gb_in : * 
gb_om : * 
gb_o v : * 
gb_pat : * 
gb_ph : * 
gb_pl : * 
gb_p r : * 
gb_ro : * 
gb^sts : * 
gb_s y : * 
gb__un : * 
gb_vi : * 
em_ba : * 
em_f un : * 
em_hum : * 
em_in : * 
em_mu : * 
em_om: * 
em_or : * 
em_ov: * 
em_pat : * 
em_ph : * 
em__pl : * 
em__ro : * 
em sts : * 



28 ■ 


1 pin 


un : * 






vi : * 

V -J— • 


30 ■ 


' P'TTI 
i CllL 


hta hum: * 


<-> J. ) 


i CULL 


hit* cr inv : * 




CULL 


ht*n othpr ' * 






Vi t" rr mi i s * * 






Vi"hrT "Pi 1 n * 


35: 


: em 


htg rod:* 


36: 


: em 


htg mam:* 


37: 


: em 


htg vrt : * 


38: 


: em 


sy : * 


39: 


: em 


htgo hum:* 


40: 


: em 


htgo mus : * 


41: 


: em 


htgo other:* 



Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 

SUMMARIES 

% 

Result Query 



o . 


Score 


Match Length 


un> 


J. JJ 


Description 


1 

1 


i ori/| 
loU4 


100. 


0 


1804 


D 


J3JJZ j jOO J 


BD235885 


Alzheimer 


z 


lo U4 


100. 


0 


1804 


D 


>\KZ Z fl u y Z 


AR224092 


Sequence 




loU4 


100. 


0 


1804 


D 




AR269223 


Sequence 


4 


lo U4 


100. 


0 


1804 


b 




AX105383 


Sequence 


5 


1804 


100. 


0 


1804 


6 


AX573821 


AX573821 


Sequence 


6 


1804 


100. 


0 


1804 


9 


AF200342 


AF200342 


Homo sapi 


7 


1790.6 


99. 


3 


2990 


9 


AF178532 


AF178532 


Homo sapi 


8 


1788.2 


99. 


1 


1885 


9 


AF200192 


AF200192 


Homo sapi 


9 


1784.4 


98. 


9 


1879 


6 


AX376004 


AX376004 


Sequence 


10 


1784.4 


98. 


9 


1879 


9 


AY358927 


AY358927 


Homo sapi 


11 


1768 .2 


98. 


0 


1864 


9 


BC014453 


BC014453 


Homo sapi 


12 


1768.2 


98. 


0 


1873 


6 


BD231786 


BD231786 


Metastati 


13 


1768.2 


98. 


0 


1873 


6 


AR411231 


AR411231 


Sequence 


14 


1768.2 


98. 


0 


1873 


9 


AF117892 


AF117892 


Homo sapi 


15 


1765.6 


97. 


9 


1862 


6 


AR136909 


AR136909 


Sequence 


16 


1765.6 


97. 


9 


1862 


6 


E30679 


E30679 ASP1. 6/200 


17 


1765.6 


97. 


9 


1862 


6 


AX775211 


AX775211 


Sequence 


18 


1765.6 


97. 


9 


1862 


6 


BD165905 


BD165905 


ASP1. 1/2 


19 


1765.6 


97. 


9 


1862 


9 


AF204944 


AF204944 


Homo sapi 


20 


1753.4 


97. 


2 


1863 


6 


AX351516 


AX351516 


Sequence 


21 


1753.4 


97. 


2 


1863 


9 


AF050171 


AF050171 


Homo sapi 


22 


1550 


85. 


9 


1621 


9 


AF212252 


AF212252 


Homo sapi 


23 


1483.6 


82. 


2 


1712 


6 


AX136403 


AX136403 


Sequence 


24 


1483.6 


82. 




1712 


6 


BD123654 


BD123654 


Secretory 


25 


1483.6 


82. 


2 


1712 


9 


AK075539 


AK075539 


Homo sapi 


26 


1482.2 


82. 


2 


2840 


9 


AF188276 


AF188276 


Homo sapi 


27 


1478.6 


82. 


0 


2429 


6 


BD231769 


BD231769 


Metastati 


28 


1478.6 


82. 


0 


2429 


6 


AR411214 


AR411214 


Sequence 


29 


1442.6 


80. 


0 


2821 


9 


AF188277 


AF188277 


Homo sapi 


30 


1263.2 


70. 


0 


1494 


6 


AX879009 


AX879009 


Sequence 


31 


1263.2 


70. 


0 


1494 


6 


BD157592 


BD157592 


Primer fo 


32 


1263.2 


70. 


0 


1494 


9 


AK027376 


AK027376 


Homo sapi 


33 


1179.4 


65. 


4 


1774 


10 


AF216310 


AF216310 Mus muscu 



34 


1134 


2 


62 


9 


1545 


6 


AR170159 


AR170159 


Sequence 


35 


1134 


2 


62 


9 


1545 


6 


AR201145 


AR201145 


Sequence 


36 


1104 




61 


2 


2514 


6 


AR263854 


AR263854 


Sequence 




^7 J J 


• u 


S? 


Q 

_? 


1 021 


6 


AR263907 


AR263907 


Sequence 


^ ft 


£ ^ 

D J ft 
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jj ( 


O 

z 




*j 




BC059963 


Xpnoous 1 


39 


625 


.2 


34. 


7 


2568 


5 


BC055989 


BC055989 


Xenopus 1 


40 


619 


.6 


34. 


3 


972 


10 


AF051150 


AF05115C 


I Mus muscu 


41 


568 


.6 


31. 


5 


845 


6 


AX866692 


AX866692 


Sequence 


42 


568 


.6 


31. 


5 


845 


6 


BD146754 


BD146754 


Primer fo 


43 


4 


96 


27. 


5 


554 


6 


AX136731 


AX136731 


Sequence 


44 


4 


96 


27. 


5 


554 


6 


BD123971 


BD123971 


Secretory 


45 


4 


94 


27. 


4 


45566 


9 


HS44C5 


AL773570 


Homo sapi 



ALIGNMENTS 



RESULT 1 
BD235885 
LOCUS 

DEFINITION 

ACCESSION 

VERSION 

KEYWORDS 

SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 

TITLE 
JOURNAL 

COMMENT 



FEATURES 

source 



BD235885 1804 bp DNA linear PAT 17-JUL-2003 

Alzheimer's disease secretase. 

BD235885 

BD235885. 1 GI : 33045655 
JP 2002526081-A/l. 
Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 
1 (bases 1 to 1804) 

Gurney,M.E., Bienkowski,M. J. , Heinrikson, R. L . , Parodi,L.A. and 
Yan,R. 

Alzheimer's disease secretase 

Patent: JP 2002526081-A 1 20-AUG-2002; 

PHARMACIA AND UPJOHN CO 

OS Homo sapiens (human) 

PN JP 2002526081-A/l 

PD 2 0-AUG-2002 

PF 23-SEP-1999 JP 2000574268 

PR 24-SEP-1998 US 60/101594 

PI MARK E GURNEY, MICHAEL JEROME BIENKOWSKI , ROBERT LEROY PI 
HEINRIKSON, 

PI LUIS A PARODI r RIQIANG YAN 

PC C12N15/09, A6lK4 5/00,A61P25/28,C07K14/47,C07K16/18,C12Nl/15, PC 
C12N1/19, 

PC 

C12N1/21,C12N5/10, C12N9/64 , C12P21/02, C12P21/08 , C12Q1/37, G01N33/ PC 

PC G01N33/50// (C12N1/21 / C12R1:19) , C12N15/00, C12N5/00 CC 

Alzheimer's disease secretase 

FH Key Location/Qualif iers 

FT source 1. .1804 

FT /organism^ 1 Homo sapiens (human) 1 . 

Location/ Qualifiers 
1. .1804 

/organism="Homo sapiens" 
/mol type=" genomic DNA" 
/db xref="taxon: 9606" 



ORIGIN 



Query Match 100.0%; Score 1804; DB 6; Length 1804; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 1804; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

Qy 61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 120 

Qy 121 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 121 CGCGTAGT-TGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 180 

Qy 181 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 24 0 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 181 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 240 

Qy 241 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 241 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 300 

Qy 301 C C C C C GCAGAAGCT ACAGATT CT C GT T GACACT G GAAGCAGTAACTTT GCCGT GGCAGGA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 301 C C C C C GCAGAAGCT ACAGATT CT C GT T GACACT G GAAGCAGTAACTTT GC CGT GGCAGGA 360 

Qy 361 AC C C C GCACT C CT ACATAGAC AC GT ACT TT GAC AC AGAGAGGT CT AGCACAT AC C GCT CC 420 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I i I I I I I I I I I 

Db 361 AC C CC GCACT C CT ACATAGAC ACGT ACT TT GACAC AGAGAGGT CT AGCACAT AC C GCT C C 420 

Qy 421 AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 4 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 421 AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 4 80 

Qy 4 81 GACCTCGTCACCATCCCCAAAGGCTTCAATACTTCTTTTCTTGTCAACATTGCCACTATT 540 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 4 81 GAC CT C GT C AC C AT CCCCAAAG GCT T CAAT ACT T CTTTTCTTGT CAACATT GC C ACT AT T 54 0 

Qy 541 T T T GAAT C AGAGAATTTCTTT T T GC CT GGGATTAAAT G GAAT GGAAT ACT T GG C CT AGCT 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

Db 541 T T T GAAT C AGAGAATTT CTTT T T GC CT GGGAT TAAAT GGAAT GGAAT ACT T GG C CT AGCT 600 

Qy 601 T AT GC CACACT T GCCAAGCC AT C AAGT T CT CT G GAGAC CT T CTT C GACTC C CT GGT GAC A 660 

I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 601 TAT GC CACACT T GCCAAGC C AT CAAGT T CT CT GGAGAC CT T CT T C GACT C C CTGGT GAC A 660 

Qy 661 CAAGCTW^CATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 72 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 661 CAAGCAAAC AT CCCCAACGT T T T CT C CAT GCAGAT GT GT G GAGCC GGCTT G CCCGTTGCT 720 

Qy 721 GGATCTGGGACCAACGGAGGTAGTCTTGTCTTGGGTGGAATTGAACCAAGTTTGTATAAA 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 721 GGAT CT GGGACCAACG GAGGT AGT CT T GT CT T G GGT G GAATT GAAC CAAGT T T GT AT AAA 780 



Qy 781 GGAGACAT CT GGTATACCCCTATTAAGGAAGAGTGGTACT ACCAGATAGAAATT CT GAAA 840 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 781 GGAGACAT CT GGTATACCCCTATTAAGGAAGAGTGGTACT ACCAGATAGAAATT CT GAAA 840 

Qy 841 T T GGAAAT T GGAG G C CAAAG CCTT AAT CT GGACT GC AGAGAGT AT AAC G C AGACAAG GCC 900 

I | | M | | I | I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I M I I I 

Db 841 TT GGAAATT GGAGGCCAAAGCCTTAAT CT GGACT GCAGAGAGT ATAACGCAGACAAGGCC 900 

Qy 901 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M II I I I I I M I I I I I I I I 

Db 901 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 

Qy 961 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 961 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1020 

Qy 1021 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1021 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 1080 

Qy 1081 T AC CT GAGAGAT GAGAACT C C AG CAGGT CAT T CC GT AT CACAAT C CT GC CT C AGCT T T AC 1140 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I 

Db 1081 T AC CT GAGAGAT GAGAAC T C C AGCAGGT CAT T C C GT AT CACAAT C CT GC CT C AGCT T T AC 1140 

Qy 1141 ATT C AG C C CAT GAT GG GGGC C GGC CTGAATT AT GAAT GT T AC C GAT T C GGCAT TT C C CCA 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I II I I I I I I I I I I 
Db 1141 AT T C AGC C CAT GAT GGGGGCCGGCCT GAAT TAT GAAT GT T ACC GAT T CG GCAT T T C C C CA 1200 

Qy 1201 TCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGAC 1260 

I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I 

Db 1201 TCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGAC 1260 

Qy 1261 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

Db 1261 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 1320 

Qy 1321 GTGTCTGAAATTTCC GGGC CTTTCTCAACAGAGGATGT AGC CAGCAACTGTGTCCCCGCT 1380 

I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 1321 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1380 

Qy 1381 CAGT CT T T GAGC GAG C C CAT T T T GT GGATT GT GT C CT AT GC GCT C AT GAGC GT C T GT G GA 1440 

I I I I M I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I II I M I I 
Db 1381 CAGTCTTTGAGCGAGCCCATTTTGTGGATTGTGTCCTATGCGCTCATGAGCGTCTGTGGA 1440 

Qy 1441 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 
Db 1441 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 

Qy 1501 CGTGACCCT GAGGTCGT CAAT GAT GAGTCCTCT CT GGT CAGACAT CGCT GGAAAT GAAT A 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 1501 C GT GAC C CT GAGGT C GT CAAT GAT GAGT C CT CT CT G GT CAGACAT CGCT GGAAAT GAAT A 1560 

Qy 1561 G C CAGGC CT GAC CT CAAGCAAC CAT GAACT CAGCT ATT AAGAAAAT C AC AT TT C CAGGG C 1620 

I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 1561 GC CAGGC CT GAC CT CAAGCAAC CAT GAACT CAGC TAT T AAGAAAAT CACAT T T C C AGGGC 1620 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 168 0 

M I I I I I M I I I I I I I I I M I I I I I I I I I I II I I I I I I II II M I I I I I I I I I I I I I I I I 

1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 1680 

1681 G CT C CC AGAT GC CT T CT AGAT T CACT GT CT T T T GAT T CTTGAT T T T CAAGCTT T CAAAT C 1740 

I I M I I I I I I I I I I I I I I I I I I I I M I I I I II I I I I I I I I I I I I I I I I I I I M I I I I I I I 
1681 GCT C C CAGAT GC CT T CT AGAT T CACT GT CT T T T GAT T CTT GAT T T T CAAGCT T T CAAAT C 1740 

1741 CT C C CT ACT T CCAAGAAAAATAATT AAAAAAAAAACT T CAT T CT AAAC CAAAAAAAAAAA 1800 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I M I I I I M I I 
1741 CT C C CT ACT T C CAAGAAAAATAATT AAAAAAAAAACT T CAT T CT AAAC CAAAAAAAAAAA 1800 

1801 AAAA 1804 
I I II 

1801 AAAA 1804 



RESULT 2 
AR224092 

LOCUS AR224092 1804 bp DNA linear PAT 26-SEP-2002 

DEFINITION Sequence 1 from patent US 6440698. 
ACCESSION AR224092 

VERSION AR224092.1 GI: 23332752 

KEYWORDS 

SOURCE Unknown. 
ORGAN I SM Unknown . 

Unclassified. 
1 (bases 1 to 1804) 

Gurney,M.E., Bienkowski, M. J. , Heinrikson, R. L . , Parodi,L.A. and 
Yan,R. 

Alzheimer 1 s disease secretase, APP substrates therefor, and uses 
therefor 

Patent: US 6440698-A 1 27-AUG-2002; 
Location/ Qualifiers 
1. .1804 
/ organism="unknown" 
/mol type=" genomic DNA" 

ORIGIN 



REFERENCE 
AUTHORS 

TITLE 

JOURNAL 
FEATURES 

source 



Query Match 100.0%; Score 1804; DB 6; 

Best Local Similarity 100.0%; Pred. No. 0; 
Matches 1804; Conservative 0; Mismatches 0; 



Length 1804; 



Indels 



0; Gaps 



0; 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



1 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

M I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

1 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 120 

I I I I I I I I I I I I I I I II I I I I I II I M M I I I I I II I I I II I M I I I I I I I II I I I I I I I 

61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 120 

121 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 180 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

121 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 180 

181 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 240 
| | | | | | I I I I I I I I I I I I I I I II II I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 



Db 181 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 24 0 

Qy 241 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I M I I I I I I I I I I I 

Db 241 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 300 

Qy 301 C C C C C G CAGAAGCT ACAGAT T CT C GT T GAC ACT GGAAGCAGT AACTTT GCCGT GGCAGGA 360 

I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 301 CCCCCGCAGAAGCTACAGATTCTCGTTGACACTGGAAGCAGTAACTTTGCCGTGGCAGGA 360 

Qy 361 ACCCCGCACTCCTACATAGACACGTACTTTGACACAGAGAGGTCTAGCACATACCGCTCC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I M I I I I I I I M 

Db 361 AC C CC GCACT C CT AC AT AGACAC GT ACT T T GAC ACAGAGAGGT CT AGCACATACCGCT CC 420 

Qy 421 AAGG GCT T T GAC GT CAC AGT GAAGT AC ACACAAG GAAGCT GGACGGGCTT CGTT GGGGAA 480 

I I I I I M I I I I I I I I II I I I I I I I I I I I I I I II M I I I I I I I I I I I I I I I I I I I I I I M I 

Db 421 AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 480 

Qy 481 GACCTCGTCACCATCCCCAAAGGCTTCAATACTTCTTTTCTTGTCAACATTGCCACTATT 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I M M I I I I I I I I I I I I I 

Db 481 GACCTCGTCACCATCCCCAAAGGCTTCAATACTTCTTTTCTTGTCAACATTGCCACTATT 540 

Qy 541 TT T GAAT C AGAGAAT TTCTTTTTGCCT GGGAT TAAAT G GAAT GGAAT ACTT GGCCT AGCT 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I 
Db 541 T T T GAAT CAGAGAAT TTCTTTTTGCCT GGGAT TAAAT GGAAT GGAAT ACTT GG CCT AGCT 600 

Qy 601 TATGCCACACTTGCCAAGCCATCAAGTTCTCTGGAGACCTTCTTCGACTCCCTGGTGACA 660 

I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I 

Db 601 TATGCCACACTTGCCAAGCCATCAAGTTCTCTGGAGACCTTCTTCGACTCCCTGGTGACA 660 

Qy 661 CAAGC7WVCATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 720 

I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 661 CAAGCAAACAT C C C CAAC GT T T T CT C CAT G CAGAT GT GT GGAGC C G GCT T GC C CGTTGCT 720 

Qy 721 GGATCTGGGACCAACGGAGGTAGTCTTGTCTTGGGTGGAATTGAACCAAGTTTGTATAAA 780 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 721 GGAT CT GGGAC CAAC G GAGGT AGT CT T GT CT T GGGT GGAATT GAAC CAAGT T T GT AT AAA 780 

Qy 781 GGAGACAT CT GGT AT AC C C CT AT TAAGGAAGAGT GGT ACT AC CAGAT AGAAAT T CT GAAA 840 

I I I I I I I I I I I I I I I I I I I I I I II M II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 781 GGAGACATCTGGTATACCCCTATTAAGGAAGAGTGGTACTACCAGATAGAAATTCTGAAA 840 

Qy 841 TTGGAAATTGGAGGCCAAAGCCTTAATCTGGACTGCAGAGAGTATAACGCAGACAAGGCC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II J I I I I I I I I I I II I I I II I I I I I I I I I I 

Db 841 TTGGAAATTGGAGGCCAAAGCCTTAATCTGGACTGCAGAGAGTATAACGCAGACAAGGCC 900 

Qy 901 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 

I I I I I I I I I I I I I I I I I II I I I I I I I I M I I II I I I I I I I I II I II I I I I I I I I I I I M I 

Db 901 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 

Qy 961 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1020 

I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I 

Db 961 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1020 

Qy 1021 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 1080 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 1021 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 1080 



Qy 1081 TACCTGAGAGATGAGAACTCCAGCAGGTCATTCCGTATCACAATCCTGCCTCAGCTTTAC 114 0 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I > I I I 
Db 1081 T AC CT GAGAGAT GAGAACT C CAGCAGGT CATT CCGT AT CACAAT CCT GCCT CAGCT TT AC 1140 

Qy 1141 ATTCAGCCCATGATGGGGGCCGGCCTGAATTATGAATGTTACCGATTCGGCATTTCCCCA 1200 

I I I I I | | | I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 1141 ATTCAGCCCATGATGGGGGCCGGCCTGAATTATGAATGTTACCGATTCGGCATTTCCCCA 1200 

Qy 1201 TCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGAC 1260 

I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1201 T C CACAAAT G CGCT GGT GAT C GGT GC C AC GGT GATGGAGGGCTT CT ACGT CAT CT T C GAC 1260 

Qy 1261 AGAGC C C AGAAGAG GGT GGGCT T C GC AGC GAGC CCCT GT GCAGAAATT GCAGGT GCT GCA 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 12 61 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 1320 

Qy 1321 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I 

Db 1321 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1380 

Qy 1381 C AGT CT T T GAGC GAGC C CATT T T GT GGAT T GT GT CCT AT GC GCT CAT GAGCGT CT GT GGA 144 0 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1381 CAGTCTTTGAGCGAGCCCATTTTGTGGATTGTGTCCTATGCGCTCATGAGCGTCTGTGGA 1440 

Qy 1441 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1441 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 

Qy 1501 C GT GAC CCT GAGGT C GT CAAT GAT GAGT C CT CT CT GGT C AGACAT C GCT GGAAAT GAATA 1560 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1501 CGT GACCCT GAGGT CGT CAAT GAT GAGT CCTCT CT GGT CAGACAT CGCTGGAAATGAATA 1560 

Qy 1561 GC CAGGC CT GAC CT CAAGCAAC CAT GAACT CAGCT AT T AAGAAAAT CACATTT CCAGGGC 1620 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1561 GC CAGG C CT GAC CT CAAGCAAC CAT GAACT CAGCT AT TAAGAAAAT CACATTT CCAGGGC 1620 

Qy 1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I 

Db 1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 1680 

Qy 1681 GCT C C CAGAT GC CT T CTAGATTCACTGTCTTTT GAT TCTT GAT TTTCAAGCTTTCAAATC 1740 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1681 GCT C C C AGAT GC CT T CT AGAT T C ACT GT CT TT T GAT T CT T GAT T T T CAAGCT T T CAAAT C 1740 

Qy 1741 CTCCCTACTTCCAAGAAAAATAATTAAA7W\AAAACTTCATTCT7\7\ACCAAAAAAAAAAA 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 1741 CTCCCTACTTCCAAGAAAAATAATTAAAAAA7\AAACTTCATTCTAAACCAAAAAAAAAAA 1800 

Qy 1801 AAAA 1804 

I I I I 

Db 1801 AAAA 1804 



RESULT 3 
AR269223 
LOCUS 



AR269223 



1804 bp DNA linear PAT 10-APR-2003 



DEFINITION 

ACCESSION 

VERSION 

KEYWORDS 

SOURCE 

ORGANISM 

REFERENCE 
AUTHORS 

TITLE 
JOURNAL 
FEATURES 

source 



Sequence 1 from patent US 6500667. 
AR269223 

AR2 69223. 1 GI : 2 9700191 

m 

Unknown . 

Unknown. 

Unclassified. 

1 (bases 1 to 1804) 

Gurney,M.E., Bienkowski,M. J. , Heinrikson, R. L . , Parodi,L.A. 
Yan, R. 

Aspartyl protease 2 (Asp2) antisense oligonucleotides 
Patent: US 6500667-A 1 31-DEC-2002; 

Location/Qualifiers 

1. .1804 

/organism= "unknown" 
/mol type= "genomic DNA" 



and 



ORIGIN 



Query Match 100.0%; Score 1804; 

Best Local Similarity 100.0%; Pred. No. 0; 
Matches 1804; Conservative 0; Mismatches 



DB 6; Length 1804; 
0; Indels 0; 



Gaps 



0; 



Qy 


1 


Db 


1 


Qy 


61 


Db 


61 


QY 


121 


Db 


121 


Qy 


181 


Db 


181 


Qy 


241 


Db 


241 


QY 


301 


Db 


301 


Qy 


361 


Db 


361 


QY 


421 


Db 


421 


Qy 


481 


Db 


481 



ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I > I I I I I > I I I I I I M I I > I > I M 

ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 120 

I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 12 0 

CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 180 

I | | | | | | I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 18 0 

GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 24 0 

I | | | | | | | M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 

GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 24 0 

GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 300 

I I I I I I I I I I I I I I I I M I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 300 

CCCCCGCAGAAGCTACAGATTCTCGTTGACACTGGAAGCAGTAACTTTGCCGTGGCAGGA 360 

I | | | | | | | | | I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CCC CCGC AGAAGCT ACAGAT T CT C GT T GACACT GGAAGCAGT AACTT T GC CGT G G C AGGA 360 

ACCCCGCACT CCTACATAGACAC GTACTTT GACACAGAGAGGTCTAGCACATACCGCT CC 42 0 

|| | | | | | M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

AC C CCGC ACT CCTACATAGACAC GT ACT TT GACACAGAGAGGTCT AGC AC AT AC C GCT CC 42 0 

AAGGGCTTT GAC GT CACAGT GAAGTACACACAAGGAAGCTGGACGGGCTT CGTT GGGGAA 48 0 
| I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I M I I I I 
AAGGGCTTT GAC GT CACAGT GAAGTACACACAAGGAAGCTGGACGGGCTT CGTT GGGGAA 4 8 0 

GACCTCGTCACCATCCCCAAAGGCTTCAATACTTCTTTTCTTGTCAACATTGCCACTATT 540 

| | | | | M I I I I I I I II I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I M I M I I I I 

GAC CT C GTCACC AT CCC CAAAGGCT T CAAT ACT T CT TT T CTTGT CAACAT T GC CACT AT T 540 



541 TTT GAAT CAGAGAAT TT CTT T T T GC CT GG GAT T AAAT GGAAT G GAAT ACT T GGC CT AGCT 600 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

541 TTT GAAT CAGAGAAT TT CTT T T T GC CT GG GAT T AAAT GGAAT G GAAT ACT T GGC CT AGCT 600 

601 TAT GCCACACTT GCCAAGC CAT CAAGT T CT CT G GAGAC CT T CT T C GACT C C CT GGT GAC A 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
601 TAT GCCACACTT GCCAAG C CAT CAAGT T CT CT G GAGAC CT T CT T C GACT C C CT GGT GAC A 660 

661 CAAGCAAACATC CCCAAC GT T T T CT C CAT GC AGAT GT GT GGAGC C GGCT T GCCCGTTGCT 72 0 

I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

661 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTT GCCCGTTGCT 72 0 

721 GGATCTGGGACCAACGGAGGTAGTCTTGTCTTGGGTGGAATTGAACCAAGTTTGTATAAA 78 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
721 GGAT CT GGGAC CAAC GGAGGTAGT CTTGTCTTGGGTGGAATTGAAC CAAGT TTGT AT AAA 78 0 

781 GGAGACAT CT GGTAT AC C C CT AT T AAGGAAGAGT GGT ACT AC CAGAT AGAAAT T CT GAAA 84 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
781 GGAGACAT CT GGT AT AC C C CT AT TAAGGAAGAGT GGT ACT AC CAGAT AGAAAT T CT GAAA 84 0 

841 TT GGAAATT GGAGGC CAAAGC CT TAAT CT GGACT GC AGAGAGT AT AAC GCAGACAAGGC C 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I 
841 TT GGAAATT GGAGGC CAAAGC CTT AAT CT GGACT GCAGAGAGT AT AAC G CAGACAAGGC C 900 

901 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 

I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

901 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 

961 GAAG CT GT GGC C C GC GCAT CT C T GAT TCCAGAATTCTCT GAT GGT TTCT GGACT G GGT CC 102 0 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I 

961 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1020 

1021 CAGCT G GC GT G CT GGAC GAAT TCGGAAACACCTTGGTCT TACT TCCCTAAAATCTC CATC 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1021 CAGCT GGCGTGCT GGAC GAATTCGGAAACACCTT GGT CTTACTTCCCTAAAATCTCCATC 108 0 

1081 TACCTGAGAGATGAGAACTCCAGCAGGTCATTCCGTATCACAATCCTGCCTCAGCTTTAC 114 0 

I | | | | | | | I | I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II M I I I I I I I I I I I I I I I I 
1081 TACCTGAGAGATGAGAACTCCAGCAGGTCATTCCGTATCACAATCCTGCCTCAGCTTTAC 114 0 

1141 ATTCAGCCCATGATGGGGGCCGGCCTGAATTATGAATGTTACCGATTCGGCATTTCCCCA 12 00 

I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
1141 ATTCAGCCCATGATGGGGGCCGGCCTGAATTATGAATGTTACCGATTCGGCATTTCCCCA 1200 

1201 TCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGAC 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1201 TCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGAC 1260 

1261 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 1320 

I I M I I I I I I I I II I I I I I I I I I I I I I I M I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

1261 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 1320 

1321 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1380 

I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I M I I I I I I I I M I 

1321 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1380 



Qy 1381 CAGTCTTTGAGCGAGCCCATTTTGTGGATTGTGTCCTATGCGCTCATGAGCGTCTGTGGA 144 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1381 CAGTCTTTGAGCGAGCCCATTTTGTGGATTGTGTCCTATGCGCTCATGAGCGTCTGTGGA 1440 

Qy 1441 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1441 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 

Qy 1501 C GT GAC C CT GAG GT C GT CAAT GAT GAGT CCTCT CT GGT CAGAC AT C G CT GGAAAT GAAT A 1560 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1501 C GT GAC C CT GAGGT C GT CAAT GAT GAGT CCTCT CT GGT CAGAC AT C G CT GGAAAT GAAT A 1560 

Qy 1561 GCCAGGCCT GACCT CAAGCAACCATGAACTCAGCTATTAAGAAAAT CACAT TT C CAGGGC 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1561 GCCAGGCCT GACCT CAAGCAAC CATGAACTCAGCTATTAAGAAAAT CACATTTC CAGGGC 162 0 

Qy 1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 168 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I II I I I I ! I I I I I I I I I I 

Db 1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 168 0 

Qy 1681 GCTCCCAGATGCCTTCTAGATTCACTGTCTTTTGATTCTTGATTTTCAAGCTTTCA7UVTC 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I II I I I I I I I I I 
Db 1681 GCTCCCAGATGCCTTCTAGATTCACTGTCTTTTGATTCTTGATTTTCAAGCTTTCAAATC 1740 

Qy 1741 CT C C CT ACT T C CAAGAAAAAT AAT TAAAAAAAAAACTT CATT CT AAAC CAAAAAAAAAAA 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 1741 CT C CCTACTT CCAAGAAAAATAATTAAAAAAAAAACTTCATTCTAAACCAAAAAAAAAAA 1800 

Qy 1801 AAAA 1804 

I I I I 

Db 1801 AAAA 1804 
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AX105383 1804 bp DNA linear PAT 30-APR-2001 

Sequence 1 from Patent WO0123533. 

AX105383 

AX10538 3.1 GI: 13921510 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 

Gurney,M. and Bienkowski , M. J. 

Alzheimer's disease secretase, app substrates therefor, and uses 
therefor 

Patent: WO 0123533-A 1 05-APR-2001; 
Pharmacia & Upjohn Company (US) 

Location/Qualif iers 

1. .1804 

/organism="Homo sapiens" 
/mol_type="unas signed DNA" 
/db xref="taxon:9606" 



ORIGIN 



Query Match 100.0%; Score 1804; DB 6; 

Best Local Similarity 100.0%; Pred. No. 0; 
Matches 1804; Conservative 0; Mismatches 0; 



Length 18 04; 
Indels 0; Gaps 



0; 



Qy 1 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

Qy 61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 12 0 

Qy 121 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 18 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 121 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 18 0 

Qy 181 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 240 

I I I I I I I II I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 181 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 24 0 

Qy 241 GT AGACAAC CT GCAGGG G GACT CT GGC CGC GGCT ACT AC CT G GAGAT GCT GAT C G GGACC 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 241 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 300 

Qy 301 C C C C C G CAGAAGCT AC AGATT CT C GT T GACACT GGAAGC AGTAACT T T GCC GT GGC AGGA 360 

. I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 301 C C C C C G CAGAAGCT AC AGATT CT C GT T GACACT GGAAGC AGTAACT T T GCC GT GGC AGGA 360 

Qy 361 AC C C C GCACT C CT AC AT AGAC AC GT ACTT T GACAC AGAGAGGT CT AGCACAT AC C GCTCC 42 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

Db 361 AC C C C GCACT C CT AC AT AGAC AC GT ACTT T GACAC AGAGAGGT CT AG CACAT AC C GCT CC 42 0 

Qy 421 AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 480 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

Db 421 AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 48 0 

Qy 481 GAC CT C GT CAC CAT C C C CAAAGG CT T CAAT ACT T CT TT T CT T GT CAACAT T G C CACT ATT 54 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 481 GAC CT C GT CAC CAT C C C CAAAGG CT T CAAT ACT T CTTTTCTTGT CAACAT T GC CACT ATT 54 0 

Qy 541 T T T GAAT CAGAGAAT TTCTTTTT GC CT GGGAT T AAAT GGAAT GGAAT ACT T G GC CT AGCT 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I 

Db 541 T T T GAAT CAGAGAAT TTCTTTTTG C CT GGGAT TAAAT GGAAT GGAAT ACT T GGC CT AGCT 600 

Qy 601 TATGCCACACTTGCCAAGCCATCAAGTTCTCTGGAGACCTTCTTCGACTCCCTGGTGACA 660 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 601 TATGCCACACTTGCCAAGCCATCAAGTTCTCTGGAGACCTTCTTCGACTCCCTGGTGACA 660 

Qy 661 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 72 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 661 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 72 0 

Qy 721 GGAT CT G GGAC CAAC G GAGGT AGT CTTGTCTTGGGT GGAAT T GAAC CAAGT T T GT AT AAA 78 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I 

Db 721 GGAT CT GGGAC CAAC G GAGGTAGT CT T GT CTTGGGT GGAAT T GAAC CAAGT TTGT AT AAA 78 0 

Qy 781 GGAGACAT CT GGT AT AC C C CT AT TAAGGAAGAGT GGT ACT ACCAG AT AGAAAT T CT GAAA 84 0 



Db 



781 



840 



Qy 841 T T G GAAAT T GGAGGCCAAAGC CT TAAT CT GGACT G CAGAGAGT AT AACGCAGACAAGGC C 900 

I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 841 TT GGAAATT GGAGGCCAAAGCCTTAAT CT GGACT GCAGAGAGT AT AACGCAGACAAGGCC 900 

Qy 901 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 901 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 

Qy 961 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1020 

Qy 1021 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 108 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 1080 

Qy 1081 TAC CTGAGAGATGAGAACTCCAGCAGGT CATT CCGTAT CACAATCCTGCCTCAGCTTTAC 114 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 TACCT GAGAGAT GAGAACT C C AG CAGGT CATT CCGTAT CACAAT CCTGCCTCAGCTTTAC 114 0 

Qy 1141 AT T CAGC C CAT GAT GGGGG C C GGC CT GAATTAT GAAT GT TAC C GAT TCGG CAT T T C C C C A 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

Db 1141 ATT CAGC C CAT GAT GGGGGC C GGC CT GAAT TAT GAAT GT TAC C GAT TCGGCAT TT C C C C A 1200 

Qy 1201 T C C ACAAAT GC GCT GGTGAT C GGT GC C AC GGT GAT GGAGG GCT T CT ACGT CAT CT T C GAC 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 1201 T C C ACAAAT GC GCT GGTGAT C GGT GC CAC GGT GAT GGAGGGCT T CT ACGT CAT CT T C GAC 1260 

Qy 12 61 AGAGC C C AGAAGAGGGTGG GCT T C GCAG C GAGC C C CT GT G C AGAAATT GCAG GT GCT GC A 132 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 12 61 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 132 0 

Qy 1321 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 

Db 1321 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1380 

Qy 1381 CAGTCTTTGAGCGAGCCCATTTTGTGGATTGTGTCCTATGCGCTCATGAGCGTCTGTGGA 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1381 CAGTCTTTGAGCGAGCCCATTTTGTGGATTGTGTCCTATGCGCTCATGAGCGTCTGTGGA 144 0 

Qy 14 41 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I 

Db 14 41 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 

Qy 1501 CGT GACCCT GAGGTCGTCAAT GAT GAGT CCT CT CT GGTCAGACAT CGCTGGAAAT GAAT A 1560 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1501 CGT GACC CT GAGGT CGT CAAT GAT GAGT C CT CT CT G GT CAGAC AT C GCTG GAAAT GAAT A 1560 

Qy 1561 GCCAGG C CT GACCT CAAGCAAC CAT GAACT CAGCT AT TAAGAAAAT CACAT TT C C AGGGC 1620 

I I I II I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1561 GC C AGGC CT GACCT CAAGCAAC CAT GAACT CAGCT AT TAAGAAAAT CACAT T T C C AGGG C 1620 

Qy 1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 168 0 

I M I I I I I I I II I I I I I I I I I I I I M I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 



1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 1680 



Qy 1681 GCT C C CAGAT G C CT T CT AGAT T CACT GT CT TTT GATT CTT GAT T T T CAAGCT T T CAAAT C 174 0 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 

Db 1681 GCTCCCAGATGCCTTCTAGATTCACTGTCTTTTGATTCTTGATTTTCAAGCTTTCAAATC 1740 

Qy 1741 CTCCCTACTTCCAAGAAAAATAATTA^^ 18 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I 
Db 1741 CT C C CT ACTT C CAAGAAAAAT AAT T AAAAAAAAAACT T CAT T CT AAAC CAAAAAAAAAAA 1800 

Qy 1801 AAAA 1804 

I I I I 

Db 1801 AAAA 1804 



RESULT 5 
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VERSION 
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AX573821 1804 bp DNA linear PAT 07-JAN-2003 

Sequence 1 from Patent EP1249498. 

AX573821 

AX573821. 1 GI: 27551476 

* 

Homo s apiens ( human ) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 

Gurney,M. and Bienkowski,M. J. 

Alzheimer's disease secretase, app substrates therefor, and uses 
therefor 

Patent: EP 1249498-A 1 16-OCT-2002; 
PHARMACIA & UPJOHN COMPANY (US) 

Location/ Qualifiers 

1. .1804 

/organism="Homo sapiens" 
/mol_type="unas signed DNA" 
/db xref="taxon: 9606" 



ORIGIN 



Query Match 100.0%; Score 1804; DB 

Best Local Similarity , 100.0%; Pred. No. 0; 
Matches 1804; Conservative 0; Mismatches 



6; Length 1804; 
0; Indels 0; 



Gaps 



0; 



Qy 

Db 



1 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 

1 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 



Qy 

Db 

Qy 

Db 

Qy 



61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 120 

I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 120 

121 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 180 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I 

12 1 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 180 

181 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 240 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 



181 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 240 

241 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 300 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I i M I I I I II I II I I I I I I I I I I I I I M I I I 

241 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 300 

301 CCCCCGCAGAAGCTACAGATTCTCGTTGACACTGGAAGCAGTAACTTTGCCGTGGCAGGA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 

301 C C C CCG CAGAAGCT ACAGAT T C T CGT T GACACT GGAAGC AGT AACTTT GCCGT GGC AGGA 360 

361 ACC C C GCACT CCT ACAT AGACACGTACTTT GACACAGAGAGGT CTAGCACATACCGCTCC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M II I I I I I I I I I I I I I I I 

361 ACCCCGCACT CCT ACAT AGACAC GTACTTT GACACAGAGAGGT CTAGCACATACCGCTCC 420 

421 AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 480 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

421 AAGGGCTTT GACGT CACAGT GAAGTACACACAAGGAAGCT GGACGGGCTTCGTTGGGGAA 4 80 

481 GAC CT C GT CAC CAT C C C CAAAGGCT T CAATACT T CTTTTCTTGT CAACATT GCCACT ATT 540 

I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

4 81 GAC CT C GT CAC CAT C C C CAAAGGCT T CAATACT TCTTTTCTTGT CAAC ATTGCCACT ATT 54 0 

541 T T T GAAT CAGAGAAT TTCTTTTTGCCT GGGAT T AAAT GGAAT GGAAT ACTTG GCCT AGCT 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
541 T T T GAAT CAGAGAATT T CTTTTTGCCT GGGAT TAAAT GGAAT GGAAT ACTTGG CCT AGCT 600 

601 TAT GC CAC ACT T GC CAAGC CAT CAAGT T CT CT GGAGAC CT T CT T C GACT C C CT GGT GACA 660 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
601 TAT GC CACACT T GC CAAG C CAT CAAGTT CT CT GGAGAC CT T CT T C GACT C C CT GGT GACA 660 

661 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 720 

I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I 

661 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 720 

721 GGAT CT G GGAC CAAC GGAGGTAGT CTTGTCTTG GGT GGAAT TGAAC CAAGT TTGT AT AAA 78 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
721 GGAT CT GG GAC CAAC GGAGGTAGT CT T GT CT T GGGT GGAAT T GAAC CAAGT T T GT AT AAA 780 

781 GGAGAC AT CT GGT AT AC C C CT AT TAAGGAAGAGT GGT ACT AC CAGAT AGAAATT CT GAAA 840 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
781 GGAGAC AT CT GGT AT AC C C CT AT TAAGGAAGAGT GGT ACT AC CAGAT AGAAAT T CT GAAA 84 0 

841 TTGGAAATTGGAGGCCAAAGCCTTAATCTGGACTGCAGAGAGTATAACGCAGACAAGGCC 900 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 

8 41 TTGGAAATTGGAGGCCAAAGCCTTAATCTGGACTGCAGAGAGTATAACGCAGACAAGGCC 900 

901 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 

I | | | | | | | | | I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

901 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 

961 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

961 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1020 

1021 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 1080 

I I I I I I I I II I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1021 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 1080 



Qy 1081 T AC CT GAGAGAT GAGAACT C C AGCAGGT CAT T C C GTATCACAAT CCT GCCT CAGCT T T AC 114 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1081 T AC CT GAGAGAT GAGAACT C C AGCAGGT CAT T CC GTATCACAAT CCT GCC T CAGCT TT AC 114 0 

Qy 1141 ATTCAGCCCATGATGGGGGCCGGCCTGAATTATGAATGTTACCGATTCGGCATTTCCCCA 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 1141 ATTCAGCCCATGATGGGGGCCGGCCTGAATTATGAATGTTACCGATTCGGCATTTCCCCA 12 00 

Qy 12 01 T C CACAAAT GCGCTGGT GAT C GGT GC C AC GGT GAT GGAGGGCTT CT AC GT C ATCTT CGAC 12 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1201 TCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGAC 1260 

Qy 12 61 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 1320 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 12 61 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 132 0 

Qy 1321 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1380 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1321 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1380 

Qy 1381 CAGT CT T T GAGC GAGCC CAT T T T GT GGAT T GT GT CCT AT GCGCT CAT GAGC GT CT GT GGA 144 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1381 CAGT CTT T GAGC GAG C C CAT T T T GT GGAT T GT GT CCT AT GCGCT CAT GAGC GT CT GT GGA 144 0 

Qy 1441 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1441 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 

Qy 1501 C GT GAC CCT GAG GT C GT CAAT GAT GAGT CCT CT CTGGT CAGACAT CGCT GGAAATGAAT A 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

Db 1501 C GT GAC CCT GAG GT C GT CAAT GAT GAGT C CT CT CT GGT CAGACATCGCT GGAAATGAAT A 1560 

Qy 1561 GC CAGGC CT GAC CT CAAG CAAC CAT GAACT CAGCTATT AAGAAAATCACAT TT CCAGGGC 1620 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1561 GCCAGGC CT GACCT CAAGCAACCAT GAACT CAGCTATTAAGAAAATCACATTTCCAGGGC 1620 

Qy 1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 168 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 168 0 

Qy 1681 GCTCCCAGATGCCTTCTAGATTCACTGTCTTTTGATTCTTGATTTTCAAGCTTTCAAATC 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 1681 GCTCCCAGATGCCTTCTAGATTCACTGTCTTTTGATTCTTGATTTTCAAGCTTTCAAATC 1740 

Qy 1741 CT C C CT ACT T C CAAGAAAAAT AAT T AAAAAAAAAACT T CATT CT AAACCAAAAAAAAAAA 1800 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1741 C T C C CT ACT T C CAAGAAAAAT AATT AAAAAAAAAACT T CAT T CT AAAC C AAAAAAAAAAA 1800 

Qy 1801 AAAA 1804 

I I I I 

Db 1801 AAAA 1804 
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CDS 



Homo sapiens chromosome 21 aspartyl protease 1 mRNA, complete cds . 
AF200342 

AF200342.1 GI:6561811 

* 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Verteforata; Euteleostomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 (bases 1 to 1804) 

Yan,R., Bienkowski, M. J. , Shuck, M.E., Miao,H., Tory,M.C, 
Pauley, A.M., Brashier , J . R . , Stratman, N . C . , Mathews, W. R. , Buhl,A.E., 
Carter, D.B., Tomasselli, A. G. , Parodi,L.A., Heinrikson, R. L. and 
Gurney,M. E . 

Membrane-anchored aspartyl protease with Alzheimer ! s disease 

beta-secretase activity 

Nature 402 (6761), 533-537 (1999) 

20057170 

10591213 

2 (bases 1 to 1804) 

Bienkowski, M. J. , Shuck, M.E., Slightom, J . L . and Drong,R.F. 

Direct Submission 

Submitted (29-OCT-1999) Genomics Research, Pharmacia&Upj ohn, 301 
Henrietta, Kalamazoo, MI 49007, USA 

Location/Qualifiers 

1. .1804 

/organisra="Homo sapiens" 

/mol_type= "mRNA" 

/db_xref="taxon:9606" 

/ chromosome="2 1 11 

1. .1557 

/ codon_start=l 

/product="aspartyl protease 1" 
/protein_id="AAFl7078 . 1" 
/db_xref="GI : 6561812" 

/translation-"MGALARALLLPLLAQWLLRAAPELAPAPFTLPLRVAAATNRWA 
P T P G P GT P AE RHAD G LALAL E P ALAS P AGAAN F LAMVDN LQ GD S GRG Y YL EML I GT P P 
QKLQILVDTGSSNFAVAGTPHSYIDTYFDTERSSTYRSKGFDVTVKYTQGSWTGFVGE 
DLVTIPKGFNTSFLVNIATIFESENFFLPGIKWNGILGLAYATLAKPSSSLETFFDSL 
VTQANIPNVFSMQMCGAGLPVAGSGTNGGSLVLGGIEPSLYKGDIWYTPIKEEWYYQI 
EILKLEIGGQSLNLDCREYNADKAIVDSGTTLLRLPQKVFDAWEAVARASLIPEFSD 
GFWTGSQLACWTNSETPWSYFPKISIYLRDENSSRSFRITILPQLYIQPMMGAGLNYE 
CYRFGI S PSTNALVI GATVMEGFYVI FDRAQKRVGFAAS PCAEI AGAAVSEI SGP FST 
E D VAS N C VP AQ S L S E P I LW I VS YALMS VC GAI LLVL I VL L L L P FRCQ RRP RD P EWN D 
ESSLVRHRWK" 



ORIGIN 



Query Match 100.0%; Score 1804; DB 9; Length 1804; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 1804; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

Qy 61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 120 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 120 



Qy 121 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 18 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 121 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 18 0 

Qy 181 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 24 0 

I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 181 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 24 0 

Qy 241 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 30 0 

I I I I I I I I I I I I I II I I I I I I I I I M I I I I I I I I II I I I I I I I I I I I I I I I I I I I I M I I 

Db 241 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 300 

'Qy 301 C C C C CG C AGAAGCT AC AGAT T CT C GTTGACACT GGAAGC AGT AACT T T GC C GT GG C AGGA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 301 C C C C CG C AGAAGCT ACAGAT T CT C GTTGACACT GGAAGC AGT AACT T T GC C GT GG C AGGA 360 

Qy 361 AC C C C G C ACT CC T AC AT AGAC AC GT ACT TT GAC ACAGAGAGGT CT AGC AC AT AC C GCT CC 42 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 361 AC C C CG C ACT CCT ACAT AGAC AC GT ACT TT GAC ACAGAGAGGT CT AGC AC AT AC C GCT CC 42 0 

Qy 421 AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 480 

I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 421 AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 48 0 

Qy 481 GAC CT C GT CACCAT C C C CAAAGGCTT CAATACT T CTT T T CTT GT CAAC ATT G C CACTATT 54 0 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 481 GACCTCGTCACCATCCCCAAAGGCTTCAATACTTCTTTTCTTGTCAACATTGCCACTATT 54 0 

Qy 541 T TT GAAT C AGAGAAT TT CT T T T T GC CT GGGAT TAAAT GGAAT GGAAT ACTT G GC CT AGCT 60 0 

I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 T TT GAAT CAGAGAAT TT CTTTTTGCCT GGGAT TAAAT GGAAT GGAAT ACTT G GC CT AGCT 600 

Qy 601 TAT GC CAC ACTT GC CAAG C CAT CAAGTT CT CT GGAGAC CT T CTT CGACT C C CT GGT GACA 660 

I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 TAT GC CACACTT GC CAAG C CAT CAAGTT CT CT GGAGAC CT T CTT CGACT C C CT GGT GACA 660 

Qy 661 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 72 0 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 661 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 720 

Qy 721 GGAT CT GGGACCAAC GGAG GT AGT CTT GT CTT GG GT GGAAT T GAAC CAAGT T T GT ATAAA 78 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I 

Db 721 GGATCTGGGACCAACGGAGGTAGTCTTGTCTTGGGTGGAATTGAACCAAGTTTGTATAAA 78 0 

Qy 781 GGAGACATCT GGT AT ACCCCT ATTAAGGAAGAGT GGTACTACCAGATAGAAATT CTGAAA 84 0 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

Db 781 GGAGACATCT GGT AT ACCCCT ATTAAGGAAGAGT GGTACTACCAGATAGAAATT CTGAAA 84 0 

Qy 841 T T GGAAAT T GGAGGC CAAAGC CT T AAT CT GGACT GCAGAGAGT ATAAC GC AGACAAGGCC 900 

I I I I I I I I I I I I I I I I I I II M I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 T T G GAAAT T GGAGGC CAAAGC CTT AAT CT GGACT GCAGAGAGT AT AACGCAGACAAGGCC 900 



Qy 

Db 



901 
901 



960 



960 



Qy 9 61 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 961 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1020 

Qy 1021 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 1080 

I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 1021 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 1080 

Qy 1081 TAC CT GAGAGAT GAGAACT C C AGC AGGT CATT C C GT AT CACAAT C CT GC CT CAGCTT T AC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1081 TAC CT GAGAGAT GAGAACT C C AGCAGGTCAT T C C GT AT CACAAT C CT GC C T CAGCT TT AC 1140 

Qy 1141 ATTCAGCCCATGATGGGGGCCGGCCTGAATTATGAATGTTACCGATTCGGCATTTCCCCA 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I 

Db 1141 AT T CAGC C CAT GATGGGGG C C GG C CT GAAT TAT GAAT GTT AC C GAT T C G GCATTT C C C C A 1200 

Qy 12 01 T C C ACAAAT GC GCTGGT GAT C G GT GC CAC G GT GAT GGAGGGCT T CT AC GT CAT CT T C GAC 1260 

I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I 

Db 1201 TCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGAC 1260 

Qy 12 61 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I 

Db 12 61 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 1320 

Qy 1321 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1321 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1380 

Qy 1381 CAGTCTTTGAGCGAGCCCATTTTGTGGATTGTGTCCTATGCGCTCATGAGCGTCTGTGGA 1440 

I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1381 CAGTCTTTGAGCGAGCCCATTTTGTGGATTGTGTCCTATGCGCTCATGAGCGTCTGTGGA 1440 

Qy 14 41 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1441 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 

Qy 1501 C GT GAC CCT GAGGTCGT CAAT GAT GAGT CCTCTCTGGT CAGAC AT C GCT GGAAAT GAAT A 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 1501 C GT GAC CCT GAGGTCGT CAAT GAT GAGT CCTCTCTGGT CAGACAT CGCT GGAAAT GAAT A 1560 

Qy 1561 GC C AGGC CT GACC TCAAGCAAC CAT GAACT CAGCT AT TAAGAAAAT C ACATT T C CAGGGC 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1561 GC C AG GC CT GACCTCAAGCAAC CAT GAACT CAGCT AT TAAGAAAAT CAC ATT T C C AG GGC 1620 

Qy 1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 168 0 

I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 168 0 

Qy 1681 GCT C C C AGAT GC CTT C T AGAT T C ACT GT CT TT T GAT T CTT G ATT T T CAAGCT T T CAAAT C 1740 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1681 GCT C C CAGAT GC CTT CT AGAT T C ACT GT CT T T T GAT T CTT GAT T T T CAAGCT T T CAAAT C 174 0 

Qy 1741 CTCCCTACTTCCAAGAAAAATAATTAAAAAAAAAACTTCATTCTAAACCAAA7WW\AAA 1800 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1741 CT C C CT ACT T C CAAGAAAAATAAT TAAAAAAAAAACT T CATT CTAAAC CAAAAAAAAAAA 1800 

Qy 1801 AAAA 1804 



1 1 1 1 

Db 1801 AAAA 1804 
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AF178532 2990 bp mRNA linear PRI 21-SEP-2000 

Homo sapiens aspartyl protease (BACE2) mRNA, complete cds . 
AF178532 

AF178532 .1 GI : 6851265 

* 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 (bases 1 to 2990) 

Solans, A. , Estivill,X. and de La Luna,S. 

A new aspartyl protease on 21q22.3, BACE2, is highly similar to 

Alzheimer's amyloid precursor protein beta-secretase 

Cytogenet. Cell Genet. 89 (3-4), 177-184 (2000) 

20422477 

10965118 

2 (bases 1 to 2990) 

Solans, A., Estivill,X. and de la Luna,S. 
Direct Submission 

Submitted ( 18-AUG-1999 ) Medical and Molecular Genetics Center, IRO, 
Avia. Castelldef els Km 2,7, L'Hospitalet de Llobregat, Barcelona 
08907, Spain 

Location/ Qualifiers 

1. .2990 

/organism="Homo sapiens" 

/mol_type="mRNA" 

/db_xref="taxon: 9606" 

/ chromosome="21" 

/map="21q22.3" 

/clone="YAC 552A3" 

1. .2990 

/gene="BACE2" 

464. .2020 

/gene="BACE2" 

/ codon_start=l 

/product="aspartyl protease" 
/protein__id="AAF29494 .1" 
/db_xref="GI : 6851266" 

/translation="MGALARALLLPLLAQWLLRAAPELAPAPFTLPLRVAAATNRWA 
P T P GP GT P AERHADGLALALE PALAS PAGAAN FLAMVDN LQGD S GRG Y YLEMLI GT P P 
QKLQILVDTGSSNFAVAGTPHSYIDTYFDTERSSTYRSKGFDVTVKYTQGSWTGFVGE 
DLVTIPKGFNTSFLVNIATIFESENFFLPGIKWNGILGLAYATLAKPSSSLETFFDSL 
VTQANI PNVFSMQMCGAGLPVAGS GTNGGS LVLGGI EPS L YKGD I WYT P I KEEWYYQI 
EILKLEIGGQSLNLDCREYNADKAIVDSGTTLLRLPQKVFDAWEAVARASLIPEFSD 
GFWTGSQLACWTNSETPWSYFPKISIYLRDENSSRSFRITILPQLYIQPMMGAGLNYE 
CYRFGISPSTNALVIGATVMEGFYVIFDRAQKRVGFAASPCAEIAGAAVSEISGPFST 
EDVASNCVPAQSLSEPILWIVSYALMSVCGAILLVLIVLLLLPFRCQRRPRDPEWND 
ESSLVRHRWK" 

ignal 2225. .2231 

/gene="BACE2" 

ignal 2959. .2964 



/gene="BACE2" 

ORIGIN 

Query Match 99.3%; Score 1790.6; DB 9; Length 2990; 

Best Local Similarity 99.8%; Pred. No. 0; 

Matches 1793; Conservative 0; Mismatches 4; Indels 0; Gaps 0; 

Qy 1 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

I I I I I II I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 464 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 52 3 

Qy 61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 120 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 524 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 583 

Qy 121 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 18 0 

I I I I I I I I I I I I I I I I I I I I I I M I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 584 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 643 

Qy 181 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 24 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 644 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 7 03 

Qy 241 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 704 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 7 63 

Qy 301 C C C C C GCAGAAGCT AC AGAT T CT C GT T GACACT GGAAGC AGTAACT TT GC C GT GGC AGGA 360 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 764 C CC C C GCAGAAGCT AC AGAT T CT C GT T GACACT GGAAGC AGTAACT T T GC C GT GGCAGGA 823 

Qy 361 AC C C C GC ACT C CT AC ATAGAC AC GTACTTT GAC AC AGAGAGGT CT AGCACAT AC C GCT CC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 824 AC C C C GCACT C CT AC AT AGACACGTACTTT GAC AC AGAGAGGT CT AGCACAT AC C GCT CC 883 

Qy 421 AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 884 AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 943 

Qy 481 GACCTCGTCACCATCCCCAAAGGCTTCAATACTTCTTTTCTTGTCAACATTGCCACTATT 540 

I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 944 GAC C T C GT C AC CAT C C C CAAAGGCTT CAAT ACT T CT T T T CTT GTCAAC AT T GC C ACT ATT 1003 

Qy 541 TTTGAATCAGAGAATTTCTTTTTGCCTGGGATTAAATGGAATGGAATACTTGGCCTAGCT 600 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 1004 T T T GAAT CAGAGAAT T T CT TT T T GC CT GGGAT T AAAT GGAAT GGAAT ACT T GGC CT AGCT 1063 

Qy 601 T AT GC CACACT TGC CAAG C CAT CAAGTT CT CT GGAGAC CT T CTT CGACT C C CT G GT GACA 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1064 TAT GC CACACT TGCCAAGCCAT CAAGT T CT CT GGAGAC CT T CT T CGACT C C CT GGT GACA 1123 

Qy 661 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 72 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I 
Db 1124 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 1183 

Qy 721 GGAT CT GGGAC CAAC GGAGGTAGT CTTGT CTT GGGT GGAAT TGAAC CAAGT TTGT AT AAA 780 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 



Db 



1184 GGATCTGGGACCAACGGAGGTAGTCTTGTCTTGGGTGGAATTGAACCAAGTTTGTATAAA 1243 



Qy 781 G GAGACAT CT GGTAT AC C C C TAT TAAGGAAGAGT GGT AC T AC CAGAT AGAAAT T CT GAAA 84 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 

Db 1244 GGAGACAT CTGGT ATAC CCCTATTAAGGAAGAGT GGT ACTAC CAGAT AGAAATT CT GAAA 1303 

Qy 841 T T GGAAAT T GGAGG C CAAAGC CT T AAT CT GGACT GC AGAGAGT ATAAC GCAGACAAGGC C 900 

I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I II II I I I I M I I I 
Db 1304 T T GGAAAT T GGAG GC CAAAGC CT T AAT CT GGACT GCAGAGAGT AT AACG C AGACAAGGC C 1363 

Qy 901 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 

I I I I I I I I I I I I I I I I I I I I I I I I! I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 1364 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 1423 

Qy 961 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1424 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 14 83 

Qy 1021 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 108 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 14 84 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 1543 

Qy 1081 T AC CT GAGAGAT GAGAACT C CAGCAG GT CAT T C C GT AT C ACAAT C CT GC CT CAGCT TT AC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 154 4 T AC CT GAGAGAC GAGAACT C CAGCAG GT CAT T C C GT AT C ACAAT C CT GC CT CAGCT TT AC 1603 

Qy 1141 ATT CAGC C CAT GAT GGGGGCCGGCCT GAATT AT GAAT GT T AC CGAT T C GGC AT T T CC C C A 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1604 ATT CAGC C CAT GAT G GGGGC C GGC CT GAATT AT GAAT GT T AC CGAT T C GG C ATT T C C C C A 1663 

Qy 1201 TCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGAC 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1664 T CCACAAAT GC G CT GGT GAT C G GT GC CAC GGT GAT G GAG GGCTT CT AC GT CAT CT T C GAC 1723 

Qy 12 61 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I! I I I I I I I I I I I I I I I I I I I I I I I 

Db 1724 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCGGGTGCTGCA 17 83 

Qy 1321 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 13 8 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I II I I 
Db 1784 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1843 

Qy 1381 CAGT CTT T GAG C GAGC C CATT T T GT G GAT T GT GT CCT AT GC G CT CAT GAGCGT CT GT GGA 14 4 0 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 18 44 CAGT CTTTGAGCGAGCCCATTTTGTGGATTGTGTCCTATGCGCT CAT GAGCGT CTGTGGA 1903 

Qy 1441 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 1904 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1963 

Qy 1501 C GT GAC CCT GAGGT C GT CAAT GAT GAGT C CT CT CTGGT CAGAC AT C G CT G GAAAT GAAT A 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

Db 1964 C GT GAC CCT GAGGT C GT CAAT GAT GAGT CCTCTCTGGT CAGAC AT C GCT G GAAAT GAAT A 2 023 

Qy 1561 G CC AGGC CT GACCT CAAG CAAC CAT GAACT C AG CT AT TAAGAAAAT CACATTT C C AGGGC 1620 

I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I 

Db 2024 G CC AGGC CT GAC CT CAAGCAAC CAT GAACT CAG CT AT TAAGAAAAT CAC ATT T C C AGGGC 2083 



Qy 

Db 

Qy 

Db 

Qy 

Db 



1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2084 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 2143 

1681 GCTCCCAGATGCCTTCTAGATTCACTGTCTTTTGATTCTTGATTTTCAAGCTTTCAAATC 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2144 GCTCCCAGATGCCTTCTAGATTCACTGTCTTTTGATTCTTGATTTTCAAGCTTTCAAATC 2203 

1741 CT C CCT ACT T C CAAGAAAAATAAT TAAAAAAAAAACT T CAT T CTAAAC CAAAAAAAA 1797 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

22 04 CT C CCT ACT T C CAAGAAAAATAAT TAAAAAAAAAACT T CAT T CTAAAC CAAAAC AGA 2260 
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AF200192 1885 bp mRNA linear PRI 16-FEB-2000 

Homo sapiens memapsin 1 mRNA, complete cds . 

AF200192 

AF200192 .1 GI : 6470290 

■ 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 (bases 1 to 1885} 

Lin,X., Koelsch,G., Wu,S., Downs, D., Dashti,A. and Tang, J. 

Human aspartic protease memapsin 2 cleaves the beta-secretase site 

of beta-amyloid precursor protein 

Proc. Natl. Acad. Sci. U.S.A. 97 (4), 1456-1460 (2000) 

20144060 

10677483 

2 (bases 1 to 1885) 

Lin,X., Koelsch,G. and Tang, J. 
Direct Submission 

Submitted (28-OCT-1999 ) Protein Studies Program, Oklahoma Medical 
Research Foundation, 825 N.E. 13th Street, Oklahoma City, OK 73104, 
USA 

Location/Qualifiers 
1. .1885 

/organism-"Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon: 9606" 
78. .1634 

It unction="cleaves beta-secretase site of beta-amyloid 
precursor protein" 

/note="membrane-associated aspartic protease 1" 
/ codon_start=l 
/product= "memapsin 1" 
/protein_id="AAF13714 . 1" 
/db_xref="GI : 6470291" 

/translation="MG7VIARALLLPLLAQWLLRAAPELAPAPFTLPLRVTAATNRWA 
PTPGPGTPAERHADGLALALEPALASPAGA7\NFLAMVDNLQGDSGRGYYLEMLIGTPP 
QKLQILVDTGSSNFAVAGTPHSYIDTYFDTERSSTYRSKGFDVTVKYTQGSWTGFVGE 
DLVTIPKGFNTSFLVNIATIFESENFFLPGIKWNGILGLAYATLAKPSSSLETFFDSL 
VTQANI PNVFSMQMCGAGLPVAGS GTNGGS LVLGGI EP S L YKGD I WYT P I KEEWYYQI 
EILKLEIGGQSLNLDCREYNADKAIVDSGTTLLRLPQKVFDAWEAVARASLIPEFSD 



GFWTGSQLACWTNSETPWSYFPKISIYLRDENSSRSFRITILPQLYIQPMMGAGLNYE 
CYRFGI S P STNALVI GATVMEGFYVI FDRAQKRVGFAASPCAEIAGAAVSEISGPFST 
EDVASNCVPAQSLSEPILWIVSYALMSVCGAILLVLIVLLLLPFRCQRRPRDPEWND 
ESSLVRHRWK" 



ORIGIN 



Query Match 99.1%; Score 1788.2; DB 9; Length 1885; 

Best Local Similarity 99.8%; Pred. No. 0; 

Matches 1801; Conservative 0; Mismatches 3; Indels 1; Gaps 1; 

Qy 1 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

Db 78 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 137 

Qy 61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 138 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGACCGCGGCCACGAAC 197 

Qy 121 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 198 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 2 57 

Qy 181 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 24 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 258 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 317 

Qy 241 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

Db 318 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 377 

Qy 301 CCCCCGCAGAAGCTACAGATTCTCGTTGACACTGGAAGCAGTAACTTTGCCGTGGCAGGA 3 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I! I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 378 CCCCCGCAGAAGCTACAGATTCTCGTTGACACTGGAAGCAGTAACTTTGCCGTGGCAGGA 4 37 

Qy 361 AC C C C GCACT C CTAC AT AGACAC GT ACT T T GAC AC AGAGAG GT CT AGCAC AT AC CGCT C C 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 438 AC CCCGCACT CCTACAT AGACAC GTACTTT GACACAGAGAGGT CTAGCACATACCGCTC C 4 97 

Qy 421 AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 498 AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 557 

Qy 481 GACCTCGTCACCATCCCCAAAGGCTTCAATACTTCTTTTCTTGTCAACATTGCCACTATT 54 0 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 558 GACCTCGTCACCATCCCCAAAGGCTTCAATACTTCTTTTCTTGTCAACATTGCCACTATT 617 

Qy 541 TT T GAAT CAGAGAATTT CT TT T T GC CT GG GAT T AAAT GGAAT GGAAT ACT T GGC CT AGCT 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 618 T T T GAAT CAGAGAATTT CTT T T T G C CT G G GATTAAAT GGAAT GGAAT ACT T GGC CT AGCT 677 

Qy 601 T AT GC C ACAC T T GC CAAGC CAT CAAGT T CT CT GGAGAC CT T CT T C GACT C C CT G GT GACA 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

Db 678 TATGCCACACTTGCCAAGCCATCAAGTTCTCTGGAGACCTTCTTCGACTCCCTGGTGACA 737 



Qy 

Db 



661 
738 



720 



797 



Qy 721 GGATCTGGGACCAACGGAGGTAGTCTTGTCTTGGGTGGAATTGAACCAAGTTTGTATAAA 78 0 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 7 98 G GAT CT GGGAC CAAC GGAGGT AGT CT T GT CT T G GGT GGAAT T GAAC CAAGTT T GT ATAAA 857 

Qy 781 GGAGACAT CTGGTAT ACCCCTATTAAGGAAGAGT GGT ACT AC CAGATAGAAATT CT GAAA 84 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 858 GGAGACAT CTGGTAT ACCCCTATTAAGGAAGAGT GGTACT AC CAGATAGAAATT CT GAAA 917 

Qy 841 T T GGAAAT T GGAGGC CAAAG C CT TAAT C T GGACT GCAGAGAGT AT AAC GC AGACAAG GCC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I 

Db 918 T T GGAAAT T GGAG G C CAAAGC CT T AAT CT GGACT GCAGAGAGT AT AAC GCAGACAAGGCC 977 

Qy 901 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 97 8 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 1037 

Qy 961 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 1038 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1097 

Qy 1021 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

Db 1098 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 1157 

Qy 1081 TAC CT GAGAGAT GAGAACT C C AGC AGGT CAT T C C GT AT C AC AAT C CT GC CT C AGCT T T AC 114 0 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 

Db 1158 TACCT GAGAGAC GAGAACT C CAGCAGGT CATT CCGTAT CACAATCCT GCCTCAGCTTTAC 1217 

Qy 1141 AT T C AGC C CAT GAT GGG GGC C G GC CT GAAT TAT GAAT GT T AC CGAT T C GGC AT T T CC C C A 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1218 AT T C AGC C CAT GAT G G GGG C C GGC CT GAAT TAT GAAT GT TAC CGAT T C GGC AT T T C C C CA 1277 

Qy 12 01 TCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGAC 12 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1278 TCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGAC 1337 

Qy 1261 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1338 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 1397 

Qy 1321 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1398 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1457 

Qy 1381 CAGTCTTTGAGCGAGCCCATTTTGTGGATTGTGTCCTATGCGCTCATGAGCGTCTGTGGA 14 4 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1458 CAGTCTTTGAGCGAGCCCATTTTGTGGATTGTGTCCTATGCGCTCATGAGCGTCTGTGGA 1517 

Qy 1441 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

Db 1518 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1577 

Qy 1501 CGT GAC C CT GAG GT C GT CAAT GAT GAGT C CT CT CT GGT CAGACAT C G CT GGAAAT GAAT A 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1578 CGT GAC C CT GAG GT C GTCAAT GAT GAGT C CT CT CT GGT CAGACAT C G CT GGAAAT GAAT A 1637 



Qy 

Db 



1561 
1638 



1620 
1697 



Qy 1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1698 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 1757 

Qy 1681 G CTC C CAGAT GC CTT CTAGAT T CACT GT CT T T T GAT T CTT GAT T T T CAAGCT T T CAAAT C 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1758 GCTCCCAGATGCCTTCTAGATTCACTGTCTTTTGATTCTTGATTTTCAAGCTTTCAAATC 1817 

Qy 1741 CT CC CT ACT T C CAAGAAAAATAATT - AAAAAAAAAACTT CAT T CTAAAC CAAAAAAAAAA 1799 

I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1818 CTCC CT ACT T C CAAGAAAAACAAT T AAAAAAAAAAACTT CAT T CTAAAC CAAAAAAAAAA 1877 

Qy 1800 AAAAA 1804 

I I I I I 

Db 1878 AAAAA 1882 
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AX376004 1879 bp DNA linear PAT 01-MAR-2002 

Sequence 71 from Patent WO0168848. 

AX376004 

AX376004.1 GI:19170395 

* 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 

Baker, K. P., Chen, J., Desnoyers , L . , Goddard,A., Godowski, P . J. , 
Gurney,A.L., Pan, J., Smith, V. , Watanabe, C . K. , Wood, W.I. and 
Zhang, Z . 

Secreted and transmembrane polypeptides and nucleic acids encoding 
the same 

Patent: WO 0168848-A 71 20-SEP-2001; 
Genentech, Inc. (US) 

Location/ Qualifiers 

1. .1879 

/organism="Homo sapiens" 
/mol_type-"unas signed DNA" 
/db xref="taxon: 9606" 



ORIGIN 



Query Match 98.9%; Score 1784.4; 

Best Local Similarity 99.9%; Pred. No. 0; 
Matches 17 85; Conservative 0; Mismatches 



DB 6; Length 1879; 

1; Indels 0; Gaps 



0; 



Qy 



Db 



94 



ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 153 



Qy 



61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 
I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II 



120 



Db 



154 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 213 



Qy 121 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 180 

I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I M I I 

Db 214 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 273 

Qy 181 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 274 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 333 

Qy 241 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

Db 334 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 393 

Qy 301 C C C C C GCAGAAGCT ACAGAT T CT C GT T GACACT G GAAGC AGTAACT TT GC CGT GGCAGGA 360 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 394 C C C C C G CAGAAGCT AC AGAT T C T C GT T GACACT GGAAG C AGTAACT TT GC C GT GGCAGGA 453 

Qy 3 61 AC C C C G CACT C CT ACAT AGACAC GT ACT TT GAC AC AGAGAGGT CT AGCACAT AC C GCT C C 42 0 

I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I 

Db 4 54 AC C CC GCACT C CT AC AT AGACAC GT ACT TT GAC AC AGAGAGGT CT AGCACAT AC C G CT C C 513 

Qy . 421 AAGGGCTTTGACGT CACAGT GAAGT ACACACAAGGAAGCT GGACGGGCTTCGTT GGGGAA 4 80 

I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 514 AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 573 

Qy 481 GAC CT CGT C AC CAT C C C CAAAGGCT T CAAT ACT T CTTTTCTTGT CAACATT GCCACT AT T 540 

I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 574 GAC CT CGT CAC CAT C C C CAAAGGCT T CAAT ACT T CTTTTCTT GT CAACATTGCCACT AT T 633 

Qy 541 T T T GAATCAGAGAAT TTCTTTTTGCCT GGGAT T AAAT GGAAT GGAAT ACTT GGC CTAGCT 600 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I 

Db 634 T T T GAATCAGAGAAT TTCTTTTTGCCTG GGAT T AAAT GGAAT GGAAT ACTTGGC CTAGCT 693 

Qy 601 TAT GC CAC ACTT GC CAAGC CAT CAAGT T CT CT GGAGAC CT T CT T CGACT C CCT GGT GACA 660 

I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 694 TAT GC CACACT T G C CAAGC CAT CAAGT T CT CT GGAGAC CT T CT T C GACT C C CT GGT GACA 753 

Qy 661 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 720 

I I I I I I I I I I I I I I I I M II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

Db 754 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 813 

Qy 721 G GAT CTGGGAC CAAC GGAGGT AGT CT T GT CT T GGGT G GAAT T GAAC CAAGT T T GT AT AAA 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

Db 814 GGAT CTGGGAC CAAC GGAGGT AGT CTT GTCTT GGGT GGAAT T GAAC CAAGT TTGT AT AAA 873 

Qy 781 GGAGACAT CT G GT AT AC C C CT AT T AAGGAAGAGT GGT ACTAC C AGAT AGAAATT CT GAAA 840 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 874 GGAGACAT CT G GT AT AC C C CT AT T AAGGAAGAGT GGT ACT AC C AGAT AGAAATT CT GAAA 933 

Qy 841 T T GGAAATT GGAGGCCAAAGC CT T AAT CTGGACT GC AGAGAGT AT AAC GCAGACAAGGC C 900 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 934 T T G GAAATT GGAGGC CAAAGC CT TAAT CTGGACT G C AGAGAGT AT AAC GCAGACAAGGC C 993 

Qy 901 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 994 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 1053 



Qy 961 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1054 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1113 

Qy 1021 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1114 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 1173 

Qy 1081 T AC CT GAGAGAT GAGAACT C C AG CAG GT CAT T C C GT AT CACAAT C CT G C CT CAGCT T T AC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 1174 T AC CTGAGAGAC GAGAACT C C AGCAGGTC AT T C C GT AT CACAAT C C T GC CT CAG CT T T AC 1233 

Qy 1141 AT T CAGC C CAT GAT GGGGGC C GGC CT GAAT TAT GAAT GTT AC C GAT T C GGCAT T T C C C C A 1200 

I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1234 ATT CAGC C CAT GAT GGGGGCCGGCCT GAATT AT GAAT GTT ACC GAT T C GGCAT T T C C C CA 1293 

Qy 1201 TCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGAC 1260 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 12 94 T C CACAAAT GC GCT G GT GAT C GGT G C CAC GGT GAT GGAGGGCT T CT AC GT CAT C T T C GAC 1353 

Qy 1261 AGAGCC C AGAAGAG GGT G GGCT T C GC AGC GAGC C C CT GT GC AGAAAT T G CAGGT GCT GCA 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1354 AGAGCCCAGAAGAGGGTGGGCTTCGCAGC GAGC CCCTGTGCAGAAATTGCAGGT GCT GCA 1413 

Qy 1321 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 1414 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1473 

Qy 1381 C AGT CT T T GAGC GAGCC CATT T T GT G GAT T GT GT C CT AT GC GCT CAT GAGCGT CT GT GGA 1440 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1474 C AGT CT T T GAGC GAGCC CATT T T GT GGAT T GT GT C CT AT GC GCT CAT GAGCGT CT GT GGA 1533 

Qy 1441 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1534 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1593 

Qy 1501 C GT GAC C CT GAG GT CGT CAAT GAT GAGT C CT CT CT GGT C AGACAT C GCT GGAAAT GAAT A 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1594 C GT GAC C CT GAGGT CGT CAAT GAT GAGT C CT CT CT GGT C AGACAT C GCT GGAAAT GAAT A 1653 

Qy 1561 G C CAGGC CT GAC CT CAAGCAAC CAT GAACT CAGCT AT TAAGAAAAT CAC ATT T C C AGGGC 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1654 G C CAGGC CT GAC CT CAAGCAAC CAT GAACT CAGCT AT TAAGAAAAT CAC ATT T C C AGGG C 1713 

Qy 1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 168 0 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I 
Db 1714 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 1773 

Qy 1681 GCT CC CAGAT G C CTT CT AGATT C ACT GT CT T T T GAT T CTT GAT T T T CAAGCTTT CAAAT C 1740 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 1774 GCT CC CAGAT GC CTT CTAGAT T C ACT GT CT T T T GATT CTT GAT T T T CAAGCT T T CAAAT C 1833 

Qy 17 41 CTCCCTACTTCCAAGAAAAATAATTAAAAAAAAAACTTCATTCTAA 17 86 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1834 CTCCCTACTTCCAAGAAAAATAATTAAAAAAAAAACTTCATTCTAA 1879 



RESULT 10 

AY358927 

LOCUS 

DEFINITION 

ACCESSION 

VERSION 

KEYWORDS 

SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 



TITLE 



JOURNAL 
PUBMED 
REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

FEATURES 

source 



gene 
CDS 



AY358927 1879 bp mRNA linear PRI 03-OCT-2003 

Homo sapiens clone DNA45493 BACE2 (UNQ418) mRNA, complete cds . 
AY358927 

AY358927. 1 GI: 37182 971 
FLI_CDNA. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 (bases 1 to 1879) 

Clark, H.F., Gurney,A.L., Abaya,E., Baker, K. , Baldwin, D., Brush, J., 
Chen, J., Chow, B., Chui,C, Crowley, C, Currell,B., Deuel, B., 
Dowd,P., Eaton, D., Foster, J., Grimaldi,C, Gu,Q., Hass,P.E., 
Heldens,S., Huang, A. , Kim, H.S., Klimowski, L . , Jin,Y., Johnson, S., 
Lee, J., Lewis, L., Liao,D., Mark,M., Robbie, E., Sanchez, C, 
Schoenf eld, J. , Seshagiri, S . , Simmons, L., Singh, J., Smith, V. , 
Stinson,J., Vagts,A., Vandlen,R., Watanabe,C, Wieand,D., Woods, K., 
Xie,M.H., Yansura,D., Yi,S., Yu,G., Yuan, J. , Zhang, M. , Zhang, Z., 
Goddard,A., Wood, W.I. and Godowski,P. 

The Secreted Protein Discovery Initiative (SPDI), a Large-Scale 

Effort to Identify Novel Human Secreted and Transmembrane Proteins: 

A Bioinf ormatics Assessment 

Genome Res. 13 (10), 2265-2270 (2003) 

12975309 

2 (bases 1 to 1879) 
Clark, H. F. 

Direct Submission 

Submitted ( 01-AUG-2 003 ) Department of Bioinf ormatics , Genentech, 
Inc., 1 DNA Way, South San Francisco, CA 94080, USA 

Location/ Qualifiers 

1. .1879 

/organism- n Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon: 9606" 
/clone="DNA454 93" 
1. .1879 

/locus_tag="UNQ418" 
94. .1650 

/locus_tag="UNQ4 18 " 
/note="PR0852" 
/codon_start=l 
/product="BACE2" 
/protein_id="AAQ89286. 1" 
/db_xref="GI : 37182972" 

/translation="MGALARALLLPLLAQWLLRAAPELAPAPFTLPLRVAAATNRWA 
PT PGP GTPAERHADGLALALEP ALAS PAGAANFLAMVDNLQGDSGRGYYLEMLIGTPP 
QKLQI LVDTGS SNFAVAGTPHS YI DT YFDTERS ST YRSKGFDVTVKYTQGSWTGFVGE 
DLVTIPKGFNTSFLVNIATIFESENFFLPGIKWNGILGLAYATLAKPSSSLETFFDSL 
VTQANIPNVFSMQMCGAGLPVAGSGTNGGSLVLGGIEPSLYKGDIWYTPIKEEWYYQI 
EILKLEIGGQSLNLDCREYNADKAIVDSGTTLLRLPQKVFDAWEAVARASLIPEFSD 
GFWTGSQLACWTNSETPWSYFPKISIYLRDENSSRSFRITILPQLYIQPMMGAGLNYE 
CYRFGI S PSTNALVI GATVMEGFYVI F D RAQ K RVG FAAS P CAE I AG AAVS EISGPFST 
EDVASNCVPAQSLSEPILWIVSYALMSVCGAILLVLIVXLLLPFRCQRRPRDPEWND 
ESSLVRHRWK" 



ORIGIN 



Query Match 98.9%; Score 1784.4; DB 9; Length 1879; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 1785; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 

Qy 1 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 94 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 153 

Qy 61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 12 0 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 154 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 213 

Qy 121 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 18 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 214 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 273 

Qy 181 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 24 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 274 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 333 

Qy 2 41 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 334 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 393 

Qy 301 C C C C C GCAGAAGCT AC AGAT T CT C GTT GACACT G GAAGC AGTAACT T T GC CGT GGC AGGA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I 

Db 394 CCCCCGCAGAAGCTACAGATTCTCGTTGACACTGGAAGCAGTAACTTTGCCGTGGCAGGA 453 

Qy 361 AC C CC GCACT C CT AC AT AGAC ACGT ACTTT GAC ACAGAGAG GT CT AGC ACAT AC C GCT C C 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4 54 ACCCCGCACT CCTACATAGACACGT ACTTTGACACAGAGAGGT CT AGCACATACCGCT CC 513 

Qy 421 AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

Db 514 AAGGGCTTT GACGT CACAGT GAAGT ACACACAAGGAAGCT GGACGGGCTTCGTT GGGGAA 573 

Qy 481 GAC CT CGT C AC CAT C C C CAAAGGCTT CAAT ACT T CTTTTCTTGT CAAC ATTGC C AC TAT T 54 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 574 GAC CT CGT C AC CAT C C C CAAAGGCTT CAAT ACT T CTTTTCTTGT CAAC ATTGC C AC TAT T 633 

Qy 541 T T T GAAT C AGAGAATT T CTTTTTGC CT GGGAT T AAAT GGAAT GGAAT ACTTGGC CT AGCT 600 

I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 634 TTTGAATCAGAGAATTTCTTTTTGCCTGGGATTAAATGGAATGGAATACTTGGCCTAGCT 693 

Qy 601 T AT GC CAC ACT T GC CAAG C CAT CAAGTT CTCT GGAGAC CT T C T T C GACT CCCT GGT GAC A 660 

I I I I I I I M I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 694 TATGCCACACTTGCCAAGCCATCAAGTTCTCTGGAGACCTTCTTCGACTCCCTGGTGACA 753 

Qy 661 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 72 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I M I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 7 54 CAAG CAAAC AT C C C CAAC GT TT T CT C CAT GCAGAT GT GT G GAGC C GG CT TGCC CGT T GCT 813 

Qy 721 G GAT CT GGGAC CAAC GGAGGT AGT CTT GT CT T G GGT GGAATT GAAC CAAGTT T GT AT AAA 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 814 GGAT CT GGGAC CAACGGAGGT AGT CTT GTCT T GGGT G GAAT T GAAC CAAGTTT GT AT AAA 873 



Qy 781 GGAGACAT CT GGT AT AC C C CT AT T AAGGAAGAGT GGT ACT AC C AGATAGAAATTCT GAAA 840 

I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I M I I I I I 

Db 874 GGAGACAT CT GGT AT AC C C CT AT T AAG GAAGAGT GGT ACT AC C AGAT AGAAATT CT GAAA 933 

Qy 841 T T GGAAAT T GGAGGC CAAAG C CT TAAT CT GGACT GCAGAGAGT AT AAC GC AGACAAGGC C 900 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 934 T T GGAAAT T GGAGGC CAAAGC CT TAAT CT GGACT GCAGAGAGT AT AAC GC AGACAAGGC C 993 

Qy 901 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 994 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 1053 

Qy 961 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1020 

I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

Db 1054 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1113 

Qy 1021 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 1080 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1114 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 1173 

Qy 1081 TAC CT GAGAGAT GAGAACT CCAGCAGGT CATTCCGTAT CACAAT CCT GCCTCAGCTTTAC 114 0 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I J I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1174 TAC CT GAGAGAC GAGAACT C C AGC AGGT CATT C C GT AT CACAAT CCT GCCT CAGCT TT AC 1233 

Qy 1141 AT T CAGCCCAT GAT GGG GG C C GGC CT GAATT AT GAAT GTT AC C GAT T C GG CAT TT C C C C A 1200 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 12 34 AT T CAGCCCAT GAT GGGGGC C GGC CT GAATT AT GAAT GT TAC C GAT T C GGC AT TT C C C CA 12 93 

Qy 1201 TCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGAC 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

Db 1294 TCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGAC 1353 

Qy 12 61 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 132 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1354 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 1413 

Qy 1321 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 138 0 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1414 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1473 

Qy 1381 CAGT CT TT GAGC GAG C C CAT T T T GT GGATTGT GT C CT AT GC GCT CAT GAGCGT CT GT GGA 14 4 0 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

Db 1474 CAGT CTTTGAG C GAG C C CAT TT T GT GGATTGT GT C CT AT GC GCT C AT GAGCGT CT GT GGA 1533 

Qy 14 41 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 

Db 1534 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1593 

Qy 1501 CGT GACCCT GAGGT CGT CAAT GAT GAGTCCT CT CT GGT CAGAC AT C GCT GGAAAT GAAT A 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1594 CGT GACCCT GAGGT CGT CAAT GAT GAGTCCT CT CT GGT CAGAC AT C GCT GGAAAT GAAT A 1653 

Qy 1561 GC CAGGCCT GAC CT CAAGCAAC CAT GAACT CAGCT AT T AAGAAAAT CACAT T T C C AGGGC 162 0 

I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1654 GC CAGGCCT GAC CT CAAGCAAC CAT GAACT CAGCT AT T AAGAAAAT CACAT T T C CAGG GC 1713 



Qy 

Db 



1621 
1714 



1680 
1773 



Qy 1681 G CT C C CAGAT GC CTT CT AGAT T CACT GT CTTT T GAT T CT T GAT TTT CAAG CT T T CAAAT C 174 0 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1774 GCT C C CAGAT GC CTT CT AGAT T CACT GT CTT T T GAT T CT T GAT TTT CAAGCT T T CAAAT C 1833 

Qy 1741 CTCCCTACTTCCAAGAAAAATAATTAAAAAAAAAACTTCATTCTAA 178 6 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1834 CTCCCTACTTCCAAGAAAAATAATTAAAAAAAAAACTTCATTCTAA 187 9 



RESULT 11 

BC014453 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 



TITLE 

JOURNAL 
MEDLINE 
PUBMED 
REFERENCE 
AUTHORS 
TITLE 
JOURNAL 



REMARK 



BC014453 1864 bp mRNA linear PRI 04-OCT-2003 

Homo sapiens beta-site APP-cleaving enzyme 2, transcript variant a, 
mRNA (cDNA clone MGC:23029 IMAGE: 4 8 68925) , complete cds . 
BC014453 

BC014 453.1 GI: 156802 03 
MGC. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleos tomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 (bases 1 to 1864) 

Strausberg, R. L . , Feingold, E . A. , Grouse, L . H . , Derge,J.G., 
Klausner , R. D . , Collins , F. S . , Wagner, L., Shenmen, C . M. , Schuler , G. D . , 
Altschul , S . F . , Zeeberg,B., Buetow, K.H., Schaef er , C . F . , Bhat,N.K., 
Hopkins , R. F. , Jordan, H. , Moore, T., Max,S.I., Wang, J., Hsieh,F., 
Diatchenko, L . , Marusina,K., Farmer, A. A. , Rubin, G.M., Hong,L., 
Stapleton,M. , Soares,M.B., Bonaldo, M. F . , Casavant , T . L . , 
Scheetz, T . E . , Brownstein, M. J . , Usdin,T.B., Toshiyuki, S . , 
Carninci,P., Prange,C, Raha,S.S., Loquellano, N . A. , Peters, G. J., 
Abramson, R. D . , Mullahy, S . J . , Bosak,S.A., McEwan,P.J., 
McKernan, K. J. , Malek,J.A., Gunaratne, P . H . , Richards, S., 
Worley,K.C, Hale,S., Garcia, A.M., Gay,L.J., Hulyk,S.W., 
Villalon, D . K. , Muzny,D.M., Sodergren, E . J . , Lu,X., Gibbs,R.A., 
Fahey,J., Helton, E., Ketteman,M., Madan,A. , Rodrigues , S . , 
Sanchez, A., Whiting, M. , Madan,A., Young,A.C, Shevchenko, Y. , 
Bouf f ard, G. G . , Blakesley, R. W . , Touchman, J. W. , Green, E.D., 
Dickson, M. C . , Rodriguez , A. C . , Grimwood,J., Schmutz, J. , Myers, R.M., 
Butterf ield, Y. S . , Krzywinski ,M. I . , Skalska,U., Smailus , D . E . , 
Schnerch,A. , Schein,J.E., Jones, S.J. and Marra,M.A. 
Generation and initial analysis of more than 15,000 full-length 
human and mouse cDNA sequences 

Proc. Natl. Acad. Sci. U.S.A. 99 (26), 16899-16903 (2002) 

22388257 

12477932 

2 (bases 1 to 1864) 
Strausberg, R. 
Direct Submission 

Submitted ( 17-SEP-2001 ) National Institutes of Health, Mammalian 
Gene Collection (MGC) , Cancer Genomics Office, National Cancer 
Institute, 31 Center Drive, Room 11A03, Bethesda, MD 20892-2590, 
USA 

NIH-MGC Project URL: http://mgc.nci.nih.gov 



COMMENT Contact: MGC help desk 

Email: cgapbs-r@mail.nih.gov 

Tissue Procurement: ATCC/DCTD/DTP 

cDNA Library Preparation: Rubin Laboratory 

cDNA Library Arrayed by: The I.M.A.G.E. Consortium (LLNL) 

DNA Sequencing by: Genome Sequence Centre, 

BC Cancer Agency, Vancouver, BC, Canada 

inf o@bcgsc . be . ca 

Steven Jones, Jennifer Asano, Ian Bosdet, Yaron Butterfield, 
Susanna Chan, Readman Chiu, Chris Fjell, Erin Garland, Ran Guin, 
Letticia Hsiao, Martin Krzywinski, Reta Kutsche, Oliver Lee, Soo 
Sen Lee, Victor Ling, Carrie Mathewson, Candice McLeavy, Steven 
Ness, Pawan Pandoh, Anna-Liisa Prabhu, Parvaneh Saeedi, Jacqueline 
Schein, Duane Smailus, Michael Smith, Lorraine Spence, Jeff Stott, 
Michael Thorne, Miranada Tsai, Natasja van den Bosch, Jill Vardy, 
George Yang, Scott Zuyderduyn, Marco Marra. 



FEATURES 

source 



gene 



CDS 



misc feature 



Clone distribution: MGC clone distribution information can be found 
through the I.M.A.G.E. Consortium/LLNL at: http://image.llnl.gov 
Series: IRAL Plate: 34 Row: 1 Column: 22 

This clone was selected for full length sequencing because it 
passed the following selection criteria: matched mRNA gi : 21040358. 

Location/ Qualifiers 

1. .1864 

/organism="Homo sapiens" 

/mol_type= ,, mRNA" 

/db_xref="taxon: 9606" 

/ cl one= " MGC : 2 3 0 2 9 IMAGE :4868925" 

/tissue_type="Skin, melanotic melanoma, high MDR. " 

/ cl one_l ib= "NI H_MGC_4 9 " 

/lab__host="DH10B-R" 

/note="Vector: p0TB7" 

1. .1864 

/gene="BACE2" 

/note="synonyms : DRAP, ALP56, AEPLC, CEAP1, ASP1, ASP21, 
BAE2, CDA13" 

/db_xref="LocusID: 25825" 
/db_xref="MIM: 605668" 
92. .1648 

/ codon_start=l 

/product="beta-site APP-cleaving enzyme 2, isoform A 

preproprotein" 

/protein_id="AAH14453. 1" 

/db_xref-"GI : 15680204" 

/db__xref-"LocusID: 25825" 

/translation="MGALARALLLPLLAQWLLRAAPELAPAPFTLPLRVAAATNRWA 
PT P GP GT PAERHADGLALALE PALAS PAGAAN FLAMVDN LQGD S GRG Y YLEML I GT P P 
QKLQILVDTGSSNFAVAGTPHSYIDTYFDTERSSTYRSKGFDVTVKYTQGSWTGFVGE 
DLWIPKGF^TSFLWIATIFESENFFLPGIKWNGILGLAYATLAKPSSSLETFFDSL 
VTQANIPNVFSMQMCGAGLPVAGSGTNGGSLVLGGIEPSLYKGDIWYTPIKEEWYYQI 
EILKLEIGGQSLNLDCREYNADKAIVDSGTTLLRLPQKVFDAWEAVARASLIPEFSD 
GFWTGSQLACWTNSETPWSYFPKISIYLRDENSSRSFRITILPQLYIQPMMGAGLNYE 
CYRFGISPS TNALVI GAT VMEGF YVI FD RAQ K RVG FAAS P CAE I AGAAVS EISGPFST 
EDVASNCVPAQSLSEPILWIVSYALMSVCGAILLVLIVLLLLPFRCQRRPRDPEWND 
ESSLVRHRWK" 
362. .1381 

/note="asp; Region: Eukaryotic aspartyl protease. Aspartyl 



(acid) proteases include pepsins, cathepsins, and renins. 
Two-domain structure, probably arising from ancestral 
duplication. This family does not include the retroviral 
nor retrotransposon proteases (pfam00077) , which are much 
smaller and appear to be homologous to a single domain of 
the eukaryotic asp proteases" 
/db xref="CDD:pfam00026" 



ORIGIN 



Query Match 98.0%; Score 1768.2; DB 9; Length 1864; 

Best Local Similarity 99.8%; Pred. No. 0; 

Matches 1770; Conservative 0; Mismatches 3; Indels 0; Gaps 0; 

Qy 1 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 92 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 151 

Qy 61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 120 

I I II I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 152 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 211 

Qy 121 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 212 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 271 

Qy 181 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 240 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 272 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 331 

Qy 241 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 300 

I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 332 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 391 

Qy 301 C C C C CGCAGAAGCT ACAGAT T C T C GT T GACACT GGAAGCAGTAACT T T GCC GT GGCAGGA 360 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 392 C C C C CGCAGAAGCT ACAGATT CT C GT T GACACT G GAAGC AGTAACT T T GCC GTGGCAGGA 4 51 

Qy 361 ACC CCGCACT CCTACATAGACACGTACTTT GACACAGAGAGGT CTAGCACATACCGCTCC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 452 ACCCCGCACT CCTACATAGACACGTACTTT GACACAGAGAGGT CTAGCACATACCGCTCC 511 

Qy 421 AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 4 80 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 512 AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 571 

Qy 481 GAC CT CGT C AC CAT C C CCAAAGGCT T CAAT ACT T CT TT T CTT GT CAACAT T GCCACT AT T 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 572 GAC CT CGT C AC CAT C C CCAAAGGCT T CAAT ACT T CT TT T CTT GT CAACAT T GCCACT AT T 631 

Qy 541 T T T GAAT C AGAGAATTT CT T T T T G C CT GGGAT TAAAT GGAAT GGAAT ACT T GGCCTAGCT 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 632 T T T GAAT C AGAGAATT T CT T T T T G C CT GGGAT TAAAT GGAAT G GAAT ACT T GGCCTAGCT 691 



Qy 

Db 



601 
692 



660 
751 



Qy 661 CAAGCAAAC AT C C C CAACGT T T T CT C CAT GC AGAT GT GT G GAG CC GG CT T GCCCGTTGCT 720 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 7 52 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 811 

Qy 721 GGAT CT GGGACCAAC G GAGGT AGT C TT GT CTT GGGT GGAAT T GAAC CAAGTT T GT ATAAA 780 

I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 812 GGATCTGGGACCAACGGAGGTAGTCTTGTCTTGGGTGGAATTGAACCAAGTTTGTATAAA 871 

Qy 781 GGAGACATCTGGTATACCCCTATTAAGGAAGAGT GGTACT ACCAGAT AGAAATT CT GAAA 84 0 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 872 GGAGACAT CT GGTAT AC CC CT ATTAAGGAAGAGT GGT AC T AC CAGAT AGAAATT CT GAAA 931 

Qy 841 TT GGAAAT T GGAGGC CAAAGC CT T AAT CT GGACT GC AGAGAGT ATAAC GCAGACAAG GCC 9 00 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 932 TT G GAAAT T GGAG GC CAAAGC CT T AAT CT GGACT GCAGAGAGTATAAC G C AGACAAGGCC 991 

Qy 901 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 

I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 9 92 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 1051 

Qy 961 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

Db 1052 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1111 

Qy 1021 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 1080 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I 

Db 1112 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 1171 

Qy 1081 T AC CT GAGAGAT GAGAACT C C AGCAGGT CAT T C CGT AT C AC AAT C CT GC CT CAG CT T TAC 114 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I 
Db 1172 TAC CT GAGAGAT GAGAACT C CAGCAGGT CAT T C CGT AT CACAAT C CT GC CT CAGCT TTAC 1231 

Qy 1141 ATT C AGC C CAT GAT GGGGGC C G GC CT GAAT TAT GAAT GTT ACCGAT T CGGCAT T T C C CC A 1200 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 1232 ATTCAGCCCATGATGGGGGCCGGCCTGAATTATGAATGTTACCGATTCGGCATTTCCCCA 1291 

Qy 1201 T C C ACAAAT G C G CT GGT GAT CGGT GC CAC G GT GAT GGAGGGCT T CT AC GT CAT CT T C GAC 1260 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I 

Db 1292 TC C ACAAAT GC GCT G GT GAT C GGT GC CAC GGT GAT GGAGG GCT T CT AC GT CAT CTT C GAC 1351 

Qy 1261 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 1320 

I I I I I I I I I I I I II I I I I I.I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1352 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 1411 

Qy 1321 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1380 

I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1412 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1471 

Qy 1381 C AGT CT T T GAG C GAGC CCAT TT T GT GGAT T GT GT C CT AT GC GCT CAT GAGC GT CT GT GGA 1440 

I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 1472 C AGT CT T T GAGC GAGC CCAT TT T GT GGAT T GT GT C CT AT G C GCT CAT GAGC GT CT GT GGA 1531 

Qy 1441 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I 

Db 1532 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1591 

Qy 1501 CGT GAC C CT GAGGT C GT CAAT GAT GAGT CCTCTCTGGT CAGACAT C GCT GGAAAT GAAT A 1560 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

1592 C GT GACC CT GAGGT C GT CAAT GAT GAGT C CT CT C T G GT CAGAC AT C G CT GGAAAT GAAT A 1651 

1561 GC CAGGCCT GAC CT CAAGCAACCAT GAACTCAGCTATTAAGAAAAT CACATTTCCAGGGC 1620 

I I I I I I I I I I I I I I I I I M II M II I I I I I I II I I I I II I I I I I I I I I I I I I I I I M II I 

1652 GC CAGGC CT GAC CT CAAGCAAC CAT GAACT C AGCT AT TAAGAAAAT C AC ATT T CCAGGGC 1711 

1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 1680 

I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I II I I I I I II I I I I I I I II I I I 

1712 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 1771 

1681 GCT CCC AGAT GC CT T CTAGAT T CACT GT CT T T T GAT T CT T GAT T T T CAAGCT TT CAAAT C 1740 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

1772 GCTCCCAGATGCCTTCTAGATTCACTGTCTTTTGATTCTTGATTTTCAAGCTTTC7VAATC 1831 

1741 CT C C CT ACT T C CAAGAAAAAT AAT TAAAAAAAA 1773 

I I I I M I I I I I I I I I I I I I I II I I I I I I I I 

1832 CTCCCTACTTCCAAGAAAAAAAAAAAAAAAAAA 1864 



RESULT 12 

BD231786 

LOCUS 

DEFINITION 

ACCESSION 

VERSION 

KEYWORDS 

SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



FEATURES 

source 



BD231786 1873 bp DNA linear PAT 17-JUL-2003 

Metastatic breast and colon cancer regulated genes. 

BD231786 

BD231786. 1 GI : 33041556 
JP 2002513542-A/18. 
Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 
1 (bases 1 to 1873) 
Xin,H. and Giese,K. 

Metastatic breast and colon cancer regulated genes 
Patent: JP 2002513542-A 18 14-MAY-2002; 
CHIRON CORP 

OS Homo sapiens (human) 

PN JP 2002513542-A/18 

PD 14-MAY-2002 

PF 24-DEC-1998 JP 2000526659 

PR 31-DEC-1997 US 60/070112 

PI HONG XIN,KLAUSE GIESE 

PC C12N15/00,C07K14/47, C07K16/18, C07K19/00, C12N9/64, C12N15/09, PC 
C12Q1/68, 

PC G01N33/50//A61K45/00,A61P35/04,C12N15/00,C12N15/00 CC 
Metastatic breast and colon cancer regulated genes FH Key 

Location/ Qualifiers 
FT source 1. .1873 

FT /organism= 1 Homo sapiens (human) 1 . 

Location/ Qualifiers 
1. .1873 

/organism="Homo sapiens' 1 
/mol_type= "genomic DNA" 
/db xref="taxon: 9606" 



ORIGIN 



Query Match 



98.0%; Score 1768.2; DB 6; Length 1873; 



Best Local Similarity 99.8%; Pred. No. 0; 

Matches 1770; Conservative 0; Mismatches 3; Indels 0; Gaps 0; 

Qy 1 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 101 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 160 

Qy 61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 161 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 220 

Qy 121 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 221 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 280 

Qy 181 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I 

Db 281 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 340 

Qy 241 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 341 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 400 

Qy 301 C C CC C GCAGAAGCTAC AGAT T CT C GTT GACACT GGAAGCAGTAACT T T G C CGT GGC AGGA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 4 01 CCCCCGCAGAAGCTACAGATTCTCGTTGACACTGGAAGCAGTAACTTTGCCGTGGCAGGA 460 

Qy 361 ACCCCGCACT CCTACATAGACACGTACTTT GACACAGAGAGGT CTAGCACATACC GCTCC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 461 ACCCC GCACT CCTACATAGACACGTACTTT GACACAGAGAGGT CTAGCACATACCGCT CC 520 

Qy 421 AAGG G CT T T GAC GTC ACAGT GAAGT ACACACAAGGAAGC T GGAC GGGCTTCGTT GGGGAA 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 521 AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTT GGGGAA 580 

Qy 481 GACCT CGT C AC CATC C C CAAAGGCT T CAAT ACTT CT TTT CTT GT CAACATT GC C ACT AT T 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 581 GACCTCGTCACCATCCCCAAAGGCTTCAATACTTCTTTTCTTGTCAACATTGCCACTATT 64 0 

Qy 541 TTT GAAT C AGAGAAT TTCTTTTTGC CT G GGAT T AAAT GGAAT GGAAT ACTT GGC CT AGCT 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 641 TTT GAAT C AGAGAAT TT CTTTTTGC CT G G GAT T A/VAT GGAAT GGAAT ACTT GGC CT AGCT 7 00 

Qy 601 TAT G C CACACT T GCCAAG C CAT CAAGTT C T CT GGAGACCT T CT T C GACT CC CT GGT GAC A 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 7 01 TAT GC CACACT T G CCAAGC C AT CAAGT T CT CT GGAGACCT T CT T C GACT CC CT GGT GAC A 760 

Qy 661 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 720 

II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 7 61 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 820 

Qy 721 GGATCTGGGACCAACGGAGGTAGTCTTGTCTTGGGTGGAATTGAACCAAGTTTGTATAAA 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 821 GGAT CT G GGAC CAAC G GAGGT AGT CT T GT CTT GG GT GGAAT T GAAC CAAGT TT GT AT AAA 880 

Qy 781 GGAGACAT CT GGT AT AC C C CT AT TAAGGAAGAGT GGT ACT AC C AGAT AGAAAT T C T GAAA 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



881 GGAGAC AT C T G GT AT AC C C CTATT AAG GAAGAGT GGT ACT AC CAGAT AGAAAT T CT GAAA 940 

841 T T GGAAAT T GGAGGCCAAAGC CT TAAT CTGGACT GC AGAGAGT ATAAC GC AGACAAGG C C 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I 
941 TT GGAAAT T GGAG GCCAAAGC CT T AAT CT GGACT G CAGAGAGT AT AAC GCAGACAAGGC C 1000 

901 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 

I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I II I I I 

1001 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 1060 

961 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 102 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1061 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1120 

1021 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 108 0 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I | 
1121 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 1180 

1081 T AC CT GAGAGATGAGAACT C CAGCAGGT CAT T C C GT AT CACAATC CT GC CT CAGCT T TAC 114 0 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
1181 TACCT GAGAGATGAGAACTC CAGCAGGTCATT CC GTATCACAATCCT GCCT CAGCTTTAC 1240 

1141 ATTCAGCCCATGATGGGGGCCGGCCTGAATTATGAATGTTACCGATTCGGCATTTCCCCA 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1241 AT T CAG C C CAT GAT GGGGGC C G GC CT GAAT TAT GAAT GT T AC CGATT C GGC ATT T C C CC A 1300 

1201 TCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGAC 12 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1301 T C CACAAAT GCGCT GGT GAT C GGT GC C AC GGT GAT GGAGG GCTT CT AC GT CAT CT T CGAC 1360 

1261 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1361 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 142 0 

1321 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
1421 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 14 8 0 

1381 CAGT CT TT GAGCGAG C C CAT T T T GT GGAT T GT GT C CT AT GC GCT CAT GAGCGT CT GT GGA 144 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I II I I I 

1481 CAGT CT T T GAGC GAGC C CAT T T T GT GGAT T GT GT C CT AT GC GCT CAT GAGC GT CT GT GGA 154 0 

1441 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
1541 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1600 

1501 C GT GAC C C T GAGGT C GT CAAT GAT GAGT CCTCTCTGGT C AGACAT CGCT GGAAAT GAAT A 1560 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1601 C GT GAC C CT GAGGT C GT CAAT GAT GAGT CCTCTCTGGT CAGAC AT C G CT GGAAAT GAAT A 1660 

1561 GC C AGG C CT GACCT CAAGCAAC CAT GAACT CAGCT AT TAAGAAAAT CAC AT T T C C AGGGC 1620 

I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1661 G C C AGGC CT GAC CT CAAGCAAC CAT GAACT CAGCT AT TAAGAAAAT CACAT T T C CAGGGC 1720 

1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 168 0 

I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1721 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 17 8 0 



Qy 1681 GCTCCCAGATGCCTTCTAGATTCACTGTCTTTTGATTCTTGATTTTCAAGCTTTCAAATC 17 40 

I I I I I I I I I M I I I I I I I I I I I I I I I M I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1781 GCTCCCAGATGCCTTCTAGATTCACTGTCTTTTGATTCTTGATTTTCAAGCTTTCAAATC 18 40 

Qy 1741 CTCCCTACTTCCAAGAAAAATAATTAAAAAAAA 1773 

I I I I I I M I I II I I I I I I I I II I I I I I I I I 
Db 1841 CTCCCTACTTCCAAGAAAAAAAAAAAAAAAAAA 1873 
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AR411231 

LOCUS 

DEFINITION 

ACCESSION 

VERSION 

KEYWORDS 

SOURCE 

ORGANISM 

REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

FEATURES 

source 



AR411231 1873 bp DNA 

Sequence 18 from patent US 6635748. 
AR411231 

AR411231. 1 GI: 4 01632 85 



Unknown . 

Unknown . 

Unclassified. 

1 (bases 1 to 1873) 

Xin,H. and Giese / K. 

Metastatic breast and colon cancer regulated genes 
Patent: US 6635748-A 18 21-OCT-2003; 

Location/Qualifiers 

1. .1873 

/ organism="unknown" 
/mol type=" genomic DNA" 



linear PAT 18-DEC-2003 



ORIGIN 



Query Match 98.0%; Score 1768.2; 

Best Local Similarity 99.8%; Pred. No. 0; 
Matches 1770; Conservative 0; Mismatches 



DB 6; Length 1873; 

3; Indels 0; Gaps 



0; 



Qy 

Db 



101 



ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 160 



Qy 

Db 



61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

161 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 22 0 



Qy 

Db 

Qy 

Db 

Qy 

Db 



121 



221 



181 



281 



241 



341 



CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 

I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I M I I I I II I I I I I I I I I I 

CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 



180 



280 



240 



GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 340 

GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 400 



Qy 

Db 



301 
401 



360 
460 



361 AC C C C GCACT C CT AC AT AGAC AC GT ACT T T GAC AC AGAGAGGT C T AGC AC AT AC C GCT C C 420 

I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

461 AC C C CG CACT C CT AC AT AGAC AC GT ACT TT GAC ACAGAGAGGT CT AG C ACAT AC C GCT C C 520 

421 AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 4 80 

I I I I I I I M I I I I II I I I I I I I II I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I M I I 

521 AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 580 

481 GAC CT C GT CAC CAT C C C CAAAG GCTT CAATACT TCTTTTCTTGT CAAC AT T G C C ACTAT T 540 

I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

581 GAC CT C GT CAC CAT C C C CAAAGGCTT CAATACT TCTTTTCTTGT CAAC AT TGC CACT AT T 640 

541 T T T GAAT CAGAGAAT TTCTTTTTGCCT GGGATT AAAT GGAAT GGAAT ACT TGGC CT AGCT 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
641 T T T GAAT CAGAGAAT TTCTTTTTGCCT GGGATT AAAT GGAAT GGAAT ACT TGG C CT AG CT 700 

601 TAT GC C AC ACT T GC CAAGCC AT CAAGT T CT CT GGAGACCT T CT T C GACT C CCT GGT GAC A 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

701 T AT GC C ACACT T GC CAAGCCAT CAAGT T CT CT GGAGACCT T CT T C GACT C CCT G GT GACA 760 

661 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 720 

I I I I I I I I I I II I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

761 C AAG CAAACAT C CC CAAC GT T T T CT C CAT GC AGAT GT GT GGAGC C GGCT T GC C C GTT GCT 82 0 

721 GGATCTGGGACCAACGGAGGTAGTCTTGTCTTGGGTGGAATTGAACCAAGTTTGTATAAA 780 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

821 GGAT CT GG GAC CAAC GGAGGT AGT CT T GT CT T G GGT GGAAT T GAAC CAAGTT T GT AT AAA 880 

781 GGAGACAT CTGGTAT ACCCCTATTAAGGAAGAGT GGTACT AC CAGATAGAAATT CT GAAA 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I . 

881 GGAGACAT CT GGT AT AC C C CT ATT AAGGAAGAGT G GT ACT AC CAGAT AGAAAT T CT GAAA 94 0 

841 T T GGAAATT GGAGGC CAAAGC CT T AAT CT GGACT GCAGAGAGT AT AAC GC AGACAAGG C C 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

941 T T GGAAATT GGAGGC CAAAGC CTT AAT CT GGACT GCAGAGAGT AT AAC GCAGACAAGGC C 1000 

901 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1001 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 1060 

961 GAAGCT GT GGC C C GC GCAT CT CT GAT T C CAGAATTCTCT GAT GGTTTCT GGACT G GGT CC 1020 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1061 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1120 

1021 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

1121 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 118 0 

1081 T AC CT GAGAGAT GAGAACT C C AGCAGGT CATT C C GT AT C ACAAT C CT GC CT CAGCT TT AC 1140 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1181 T AC CT GAGAGAT GAGAACT C C AGCAGGT CATT C C GT AT C ACAAT CCT GC CT C AGC T TT AC 1240 

1141 AT T CAG CC CAT GAT GGGG GC C GGC CT GAAT TAT GAAT GT T AC C GATT C GG CATT T C CC CA 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1241 AT T CAGCC CAT GAT GGGGGC C GGC CT GAAT TAT GAAT GT T AC C GATT C GGCATT T C CC CA 1300 



Qy 12 01 TCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGAC 12 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1301 TCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGAC 1360 

Qy 1261 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 

Db 1361 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 1420 

Qy 1321 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1380 

I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1421 GT GT C T GAAATT T CCGGGCCTTTCT CAAC AGAGGAT GT AGC C AG CAACT GT GTC CC C GCT 14 8 0 

Qy 1381 C AGT CT T T GAGC GAG C C CAT T T T GT GGATT GT GT C C TAT GC GCT CAT GAGC GT CT GT GGA 14 4 0 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 14 81 CAGT CT T T GAGC GAGC C CAT T T T GT GGATT GTGT C CT AT GC GCT CAT GAG C GT CT GT GGA 1540 

Qy 1441 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 

I I I I I II I I I I I I I I I II I I II I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1541 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1600 

Qy 1501 C GT GAC C CT GAGGT C GT CAAT GAT GAGT CCT CT C T GGT CAGACAT C GCT GGAAAT GAAT A 1560 

I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

Db 1601 C GT GAC CCT GAGGT CGT CAAT GAT GAGT CCT CT CT G GT CAGACAT C GCT GGAAAT GAAT A 1660 

Qy 1561 GC C AGGCCT GAC CT CAAGCAAC CAT GAACT CAG CT AT T AAGAAAAT CXCATTT C C AGGGC 1620 

I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1661 GC C AG GC CT GAC CT CAAGCAAC CAT GAACT C AGCT AT TAAGAAAAT C ACATTT C C AGGGC 1720 

Qy 1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 168 0 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1721 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 1780 

Qy 1681 G CT C C CAGAT GC CT T CT AGAT T C ACT GTCT TTT GAT T CT T GAT T T T CAAGCT T T CAAAT C 174 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

Db 1781 GCT C CC AGAT GCCT T CT AGAT T CAC T GT CT TTT GATT CT T GAT TTT CAAGCT TT CAAAT C 1840 

Qy 1741 CT C C CTACT T C CAAGAAAAATAATTAAAAAAAA 1773 

I I I I I I I I I I I I I I I I I I I I II II I I I I I I 
Db 1841 CTCC CTACT TCCAAGAAAAAAAAAAAAAAAAAA 1873 



RESULT 14 

AF117892 

LOCUS 

DEFINITION 

ACCESSION 

VERSION 

KEYWORDS 

SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 



TITLE 



AF117892 1873 bp mRNA linear PRI 14-JUL-2000 

Homo sapiens aspartic-like protease mRNA, complete cds . 

AF117892 

AF117892.1 GI:5565865 

» 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 
1 (bases 1 to 1873) 

Xin,H., Stephans, J. C. , Duan,X., Harrowe,G., Kim,E., Grieshammer,U. , 
Kingsley,C. and Giese,K. 

Identification of a novel aspartic-like protease differentially 
expressed in human breast cancer cell lines 



JOURNAL 
MEDLINE 
PUBMED 
REFERENCE 
AUTHORS 

TITLE 
JOURNAL 

FEATURES 

source 



CDS 



Biochim. Biophys . Acta 1501 (2-3), 125-137 (2000) 

20298348 

10838186 

2 (bases 1 to 1873) 

Xin,H., Stephans, J.C. , Duan,X., Harrowe,G., Kim, E., Grie shammer , U . 
and Giese,K. 
Direct Submission 

Submitted ( 05- JAN-1999 ) Technologies, Chiron Co., 4560 Horton St., 
4.5103, Emeryville, CA 94608, USA 

Location/ Qualifiers 

1. .1873 

/organism="Homo sapiens" 
/mol_type= M mRNA M 
/db_xref= M taxon: 9606" 
/cell_type=" stroma" 
/tissue_type="bone marrow" 
101. .1657 
/codon_start==l 

/product="aspartic-like protease" 
/protein_id="AAD4 524 0. 1" 
/db_xref ="GI : 5565866" 

/translation="MGALAR7VLLLPLLAQWLLRAAPELAPAPFTLPLRVAAATNRWA 
PTPGPGTPAERHADGLALALEPALAS PAGAANFLAMVDNLQGDSGRGYYLEMLIGTPP 
QKLQILVDTGSSNFAVAGTPHSYIDTYFDTERSSTYRSKGFDVTVKYTQGSWTGFVGE 
DLVTIPKGFNTSFLVNIATIFESENFFLPGIKWNGILGLAYATLAKPSSSLETFFDSL 
VTQANIPNVFSMQMCGAGLPVAGSGTNGGSLVljGGIEPSLYKGDIWYTPIKEEWYYQI 
EILKLEIGGQSLNLDCREYNADKAIVDSGTTLLRLPQKVFDAWEAVARASLIPEFSD 
GFWTGSQLACWTNSETPWSYFPKISIYLRDENSSRSFRITILPQLYIQPMMGAGLNYE 
C YRFG ISP S TNALVI GAT VME G F YVI FD RAQKRVG FAAS P CAE I AGAAVS E I S G P FS T 
EDVASNCVPAQSLSEPILWIVSYALMSVCGAILLVLIVLLLLPFRCQRRPRDPEWND 
ESSLVRHRWK" 



ORIGIN 



Query Match 98.0%; Score 1768.2; 

Best Local Similarity 99.8%; Pred. No. 0; 
Matches 1770; Conservative 0; Mismatches 



DB 9; Length 1873; 



3; Indels 



0; Gaps 



0; 



Qy 

Db 



1 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

101 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 160 



QY 
Db 



61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

161 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 220 



QY 



Db 



121 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 180 

I I I I I I I I I I I I M I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

221 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 280 



Qy 

Db 

Qy 

Db 



181 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 240 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

281 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 340 

241 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 300 

I I I I I I II I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I 

341 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 400 



Qy 301 CCCCCGCAGAAGCTACAGATTCTCGTTGACACTGGAAGCAGTAACTTTGCCGTGGCAGGA 360 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 401 C C C C C GC AGAAG CT ACAGAT T CT C GT T GACACT GGAAGCAGTAACT T T G C C GT GG C AGGA 460 

Qy 361 AC C C C GC ACT C CT AC AT AGAC AC GT ACTTT GAC ACAGAGAGGT CT AG C ACAT ACC GCT C C 42 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 4 61 AC C C C G CACT C CT ACAT AGAC AC GT ACTTT GACACAGAGAGGT CT AGC ACATAC C GCT C C 52 0 

Qy 421 AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 48 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 521 AAGGGCTTT GAC GT C AC AGT GAAGT ACACACAAGGAAGCT G GAC GGGCTT CGT T G G GGAA 58 0 

Qy 481 GAC CT C GTCAC CAT C C C CAAAG GCT T CAAT AC TT CTTTTCTT GT CAAC ATTGC CACT AT T 54 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 581 GAC CT C GT CAC CAT C C C CAAAGGCT T CAAT ACT T CT T TT CTT GT CAAC ATT GC CACT AT T 64 0 

Qy 541 T T T GAATCAGAGAAT TTCTTTTTGC CT GGGAT T AAAT GGAAT GGAAT ACTT GGC CT AG CT 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 641 T T T GAAT CAGAGAAT TTCTTTTT GC CT GGGAT T AAAT GGAAT GGAAT ACTT GGC C T AGCT 700 

Qy 601 TATGCCACACTTGCCAAGCCATCAAGTTCTCTGGAGACCTTCTTCGACTCCCTGGTGACA 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I 
Db 7 01 TATGCCACACTTGCCAAGCCATCAAGTTCTCTGGAGACCTTCTTCGACTCCCTGGTGACA 7 60 

Qy 661 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 72 0 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 7 61 CAAGCAAACAT C C C CAAC GT T T T CT C CAT GCAGAT GT GT GGAG C C GGCTTGC C C GT T G CT 82 0 

Qy 721 GGAT CT GGGAC CAAC G GAGGT AGT CT TGT CT T GGGT G GAAT T GAAC CAAGTTT GT AT AAA 78 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I 

Db 821 GGAT CT GGGAC CAAC GGAGGT AGT CTTGT CT T GGGT GGAAT T GAAC CAAGTTT GT ATAAA 88 0 

Qy 781 GGAGACATCT GGTATAC CCCTATTAAGGAAGAGT GGT ACTACCAGATAGAAATT CT GAAA 84 0 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 8 81 GGAGACATCT GGTATAC CCCTATTAAGGAAGAGT GGT ACTACCAGATAGAAATT CTGAAA 940 

Qy 841 T T GGAAAT T GGAGG C CAAAGC CT T AAT CT GGACT GC AGAGAGT AT AACGCAGACAAGGC C 900 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 941 TT GGAAATT GGAGGCCAAAGCCTTAATCT GGACT GCAGAGAGT ATAACGCAGACAAGGCC 1000 

Qy 901 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1001 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 1060 

Qy 961 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1020 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1061 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1120 

Qy 1021 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 1121 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 1180 

Qy 1081 T ACCTGAGAGAT GAGAACTCCAGCAGGTCAT T CCGTAT CACAAT CCTGCCTCAGCTTT AC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1181 T ACC TGAGAGAT GAGAACT C C AG C AGGT CAT T CC GT AT CACAAT CCTGCCT CAGC TT T AC 12 4 0 

Qy 1141 AT T C AGCCC AT GAT G GGG GC C GGC CTGAATT AT GAAT GT T AC C GATTCGGC AT T T C C C C A 1200 



Db 1241 ATT CAGCC C AT GAT GGGGGC CG GC CT GAAT TAT GAAT GTT AC C GAT T C GG CAT T T C C C CA 1300 

Qy 1201 TCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGAC 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1301 TCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGAC 1360 

Qy 1261 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 1361 AGAGC C C AGAAGAG GGT GGG CT T C GCAGC GAGC C C CT GT GC AGAAAT T GC AGGT G CT G CA 1420 

Qy 1321 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1380 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1421 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1480 

Qy 1381 C AGT CT T T GAG C GAGCC C AT T T T GT GGAT T GT GT C C T AT GC GCT C AT GAGCGT C T GT GGA 1440 

M II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I 

Db 14 81 CAGTCTTTGAGCGAGCCCATTTTGTGGATTGTGTCCTATGCGCTCATGAGCGTCTGTGGA 1540 

Qy 1441 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 

I I I I I I I I I I I I I I I I I I I I II M I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I 
Db 1541 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1600 

Qy 1501 C GT GAC C C T GAGGT CGT CAAT GAT GAGT C C T CT CT GGT C AGAC AT C GCT GGAAAT GAAT A 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1601 C GTGAC C CT GAGGT CGT CAAT GAT GAGT C CT C T CT G GT C AGAC AT C GCT GGAAAT GAAT A 1660 

Qy 1561 GCC AGGC CT GAC C T CAAGCAAC CAT GAACT C AGCT ATT AAGAAAAT C AC AT T T C C AGGGC 162 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1661 GCCAGGCCT GACCTCAAGCAACCATGAACT CAGCTATTAAGAAAAT CACATTT CCAGGGC 1720 

Qy 1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1721 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 1780 

Qy 1681 GCT C C C AGAT GC CTT CT AGAT T CACT GT CT T T T GAT TCT T GAT TTT CAAGCT T T CAAAT C 174 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 1781 GCT C C C AGAT GCCTT CT AGATT CACT GT CT TT T GAT T CTT GAT TTT CAAGCT T T CAAAT C 184 0 

Qy 1741 CT C C CT ACT T C CAAGAAAAATAATT AAAAAAAA 1773 

I I I I I I I I I I II I I I I I II I II I I I I I I I I 
Db 1841 CTCCCTACTTCCAAGAAAAAAAAAAAAAAAAAA 1873 



RESULT 15 

AR136909 

LOCUS 

DEFINITION 

ACCESSION 

VERSION 

KEYWORDS 

SOURCE 

ORGANISM 

REFERENCE 
AUTHORS 
TITLE 



AR136909 1862 bp DNA 

Sequence 1 from patent US 6162630. 
AR136909 

AR136909. 1 GI: 1447 8159 

* 

Unknown . 

Unknown . 

Unclassified. 

1 (bases 1 to 1862) 

Powell, D. J., Southan,C, Chapman, C . G . 
ASP1 



linear 



PAT 16-JUN-2001 



and Evans, J. R 



JOURNAL Patent: US 6162630-A 1 19-DEC-2000; 
FEATURES Location/Qualifiers 
source 1. .1862 

/ organism= "unknown" 
/mol_type- "una s signed DNA" 

ORIGIN 

Query Match 97.9%; Score 1765.6; DB 6; Length 1862; 

Best Local Similarity 99.8%; Pred. No. 0; 

Matches 1768; Conservative 0; Mismatches 4; Indels 0; Gaps 0; 

Qy 1 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 91 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 150 

Qy 61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 12 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

Db 151 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 210 

Qy 121 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 18 0 

II I II I M I I I I I I I I I I I I I I I I I I I M I I I II I I I I I I I I I I I I I I I II I I I I I I I I I 

Db 211 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 27 0 

Qy 181 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 24 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 271 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 330 

Qy 241 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 331 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 390 

Qy 301 C C C C C G CAGAAGCT AC AGAT T CT C GTT GAC ACT GGAAG C AGT AACTT T GC C GT GG C AGGA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 391 CCCCCGCAGAAGCTACAGATTCTCGTTGACACTGGAAGCAGTAACTTTGCCGTGGCAGGA 450 

Qy 361 AC C C C GC ACT C CT ACAT AGAC AC GT ACT T T GACACAGAGAGGT CT AGC ACAT AC CGCT C C 42 0 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 

Db 4 51 ACCCCGCACT CCT ACATAGACACGTACTTT GACACAGAGAGGT CTAGCACATACCGCTCC 510 

Qy 421 AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 480 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 511 AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 57 0 

Qy 481 GAC CT C GT CAC CAT C CCCAAAGG CT T CAAT ACTT CTT T T CT T GT CAAC AT T GC CACT ATT 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 571 GACCTCGTCACCATCCCCAAAGGCTTCAATACTTCTTTTCTTGTCAACATTGCCACTATT 630 

Qy 541 T T T GAAT C AGAGAATTT CT T T T T GC CT GGGAT T AAAT GGAAT G GAAT ACT T GG C CT AGCT 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 631 T T T GAAT C AGAGAATTT CT T TT T GC CT GGGAT T AAAT GGAAT G GAAT ACT T GG C CT AGCT 690 

Qy 601 TATGCCACACTTGCCAAGCCATCAAGTTCTCTGGAGACCTTCTTCGACTCCCTGGTGACA 660 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 691 TATGCCACACTTGCCAAGCCATCAAGTTCTCTGGAGACCTTCTTCGACTCCCTGGTGACA 750 

Qy 661 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 72 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 7 51 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 810 

Qy 721 GGATCT GGGAC CAACGGAGGTAGT CTT GT CTTGGGT GGAATT GAACCAAGTTT GTATAAA 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I M I I I I 

Db 811 GGAT CT GG GAC CAACGGAGGTAGT CTTGTCTTGGGT GGAATT GAACCAAGT T T GTATAAA 870 

Qy 781 GGAGAC AT CT GGT AT AC C C C TAT T AAG GAAGAGT GGT ACT AC C AGAT AGAAAT T CT GAAA 840 

I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 871 GGAGAC AT CT G GT AT AC C C CT AT T AAGGAAGAGT G GTACTAC CAGAT AGAAAT T CT GAAA 930 

Qy 841 TT G GAAAT T GGAGGCCAAAGC CTTAAT CT GGACT GC AGAGAGT AT AAC GC AGACAAG GC C 900 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 931 T T G GAAAT T GGAGGCCAAAG C CT T AAT CT GGACT GC AGAGAGT AT AAC GCAGACAAGGC C 990 

Qy 901 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II M I I I I I I I I I I I I I I 

Db 991 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 1050 

Qy 961 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCT GGACT GGGTCC 1020 

I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1051 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCT GAT GGTTTCT GGACT GGGTCC 1110 

Qy 1021 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 1111 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 117 0 

Qy 1081 TAC CT GAGAGAT GAGAACT C CAGCAGGT CAT T C C GT AT CACAATCCT GC CT C AGCT TTAC 1140 

I I I I I I I I I I! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1171 T AC CT GAGAGACGAGAAC T C C AG CAGGT CAT T C C GT AT CACAAT CCT GCCT C AGCT TTAC 1230 

Qy 1141 AT T CAGC C CAT GAT GG GGG C C GGC CT GAAT TAT GAAT GTT AC C GAT T CGGCAT TT C C C CA 1200 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I 

Db 1231 AT T CAGC C CAT GAT GGGGGCCGGCCT GAAT TAT GAAT GT T AC CGAT T C GGCAT T T C CC CA 1290 

Qy 1201 TCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGAC 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I 

Db 1291 TCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGAC 1350 

Qy 12 61 AGAGC C CAGAAGAGG GT GGGCTTCG CAGC GAGC C CCT GT GCAGAAAT T GCAGGT GCT GC A 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 1351 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 1410 

Qy 1321 GT GT CT GAAATTT C CGGGCCTT T CT CAAC AGAGGAT GT AGC CAGCAACT GT GT C C C C G CT 138 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1411 GTGTCT GAAATTT CCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1470 

Qy 1381 C AGT C T T T GAGCGAGC C C ATT T T GT GGAT T GT GT C CTAT G C GCT CAT GAG C GT CT GT GGA 14 4 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 1471 CAGTCTTTGAGCGAGCCCATTTTGTGGATTGTGTCCTATGCGCTCATGAGCGTCTGTGGA 1530 

Qy 1441 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 1531 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1590 

Qy 1501 C GT GAC C CT GAGGT CGT CAAT GAT GAGT CCTCTCTGGT CAGAC AT C GCT GGAAAT GAAT A 1560 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1591 CGT GAC C CT GAGGT CGT CAAT GAT GAGT CCTCTCTGGT CAGAC AT C GCT GGAAAT GAAT A 1650 



Qy 1561 GCCAGGC CT GAC CT CAAGCAAC CAT GAACT CAGCT ATTAAGAAAAT CAC AT T T C CAGGGC 1620 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I II I M I I I I I I 

Db 1651 GCCAGGC C T GAC CT CAAG CAAC CAT GAACT CAGCTATTAAGAAAAT CAC AT T T C C AGGG C 1710 

Qy 1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 168 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I 
Db 1711 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 1770 

Qy 1681 GCT C C CAGAT G C C T T C T AGATT C ACT GT CT T TT GATT CT T GAT T T T CAAGCT TT CAAAT C 17 4 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I I M I I I I I I I I I I I I I I 
Db 1771 GCTCCCAGATGCCTTCTAGATTCACTGTCTTTTGATTCTTGATTTTCAAGCTTTCAAATC 1830 

Qy 1741 CTCCCTACTTCCAAGAAAAATAATTAAAAAAA 1772 

I I I I I I I I I I I II I I I I I I I II I I I I I I I 
Db 1831 CTCCCTACTTCCAAGAAAAAAAAAAAAAAAAA 1862 



Search completed: February 28, 2004, 05:40:18 
Job time : 6912 sees 



GenCore version 5.1.6 
Copyright (c) 1993 - 2004 Compugen Ltd. 



OM nucleic - nucleic search, using sw model 



Run on 



February 28, 2004, 02:44:52 ; Search time 702 Seconds 

(without alignments) 
10917.022 Million cell updates/sec 



Title: 

Perfect score: 
Sequence : 



US-09-668-314C-1 
1804 

1 atgggcgcactggcccgggc 



aaaccaaaaaaaaaaaaaaa 1804 



Scoring table: IDENTITY_NUC 

Gapop 10.0 , Gapext 1.0 

Searched: 3373863 seqs, 2124099041 residues 

Total number of hits satisfying chosen parameters 

Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 

Post-processing: Minimum Match 0% 

Maximum Match 100% 
Listing first 45 summaries 



6747726 



Database : 



N_Geneseq_29JanO 

1: geneseqnl980s 

2: geneseqnl990s 

3: geneseqn2000s 

4: geneseqn2001a 

5: geneseqn2001b 

6: geneseqn2002s 

7: geneseqn2003a 

8: geneseqn2003b 

9: geneseqn2003c 

10: geneseqn2004 



4:* 

* 
* 
* 

s : * 
s : * 

* 

s : * 
s : * 
s : * 
s : * 



Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 
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APAQ1 QftR 


A r3 Q1 QQ C, 


Novel 


hum 


o 1 


X / o ft 


A 
. ft 


Q ft 


y 


x o / y 


7 
/ 


/\u/\o O O Z ft 


A ( -af!'3 ^9 4 
ACa D -J DZ ft 


Novel 


hum 


"3 9 
oZ 


1 7 ft /l 
X / O 4 


. ft 


Q ft 

y o . 


q 

y 


i ft 7 q 
x o / y 


7 


AP2iftQ4 1 fl 

/\L-/\o y ft X U 


Ar-aftQ41 0 
.rtL-a O y H X U 


cDNA enco 


JO 


1 7 ft /I 
X / O ft 


A 
. ft 


Q ft 

y o . 


q 
y 


i ft 7 q 
x o / y 


7 
f 


J-\\^J\ I o ft Z U 


Ar>a7?490 


Human 


sec 


O ft 


1 7 ft A 


A 

. ft 


Q ft 

y o . 


q 
y 


i ft 7 q 
x o / y 


7 
f 


APZXO R7 ^ 


AL-aU J fOO 


Human 


sec 


J D 


1 7 ft A 
X / O ft 


. ft 


Q ft 

y o . 


q 
y 


1 ft 7 q 
x o / y 


7 




Apa ft S fi q 
rt.t— aDD JO J 


cDNA enco 


Q £ 
O D 


1 "7 ft /I 


A 

. fl 


Q ft 

yt( . 


q 
y 


1 ft 7 Q 

x o / y 


7 


7\ r* 1T9 n T A A 
/\U r Z U X ft ft 


Ar«-F9 014 4 
rt.C X Z U X ft ft 


Human 


sec 


3 1 


1 *7 ft /I 
X / O ft 


. ft 


y o . 


y 


i ft 7 q 
x o / y 


7 
1 


APTT1 Q ^ ^ fl 

r x y d o u 


A r f 1 q c: o a 
r\C- 11" jjU 


Human 


sec 


38 


1784 


. 4 


98 . 


9 


1879 


1 


ACD21818 


Acazlol o 


Human 


sec 


39 


1784 


.4 


98. 


9 


1879 


1 


ACF12983 


Acfl2983 


Human 


sec 


40 


1784 


.4 


98. 


9 


1879 


1 


ACD25086 


Acd25086 


Human 


sec 


41 


1784 


.4 


98. 


9 


1879 


1 


ACF00135 


Acf00135 


Human 


sec 


42 


1784 


.4 


98. 


9 


1879 


1 


ACA72192 


Aca72192 


Novel 


hum 


43 


1784 


.4 


98. 


9 


1879 


1 


ACD04716 


Acd04716 


Novel 


hum 


44 


1784 


.4 


98. 


9 


1879 


1 


ACD18177 


Acdl8177 


Human 


sec 


45 


1784 


.4 


98. 


9 


1879 


1 


ACD08184 


Acd08184 


Human 


sec 



ALIGNMENTS 



RESULT 1 
AAA15661 

ID AAA15661 standard; cDNA; 1804 BP. 
XX 

AC AAA15661; 
XX 

DT 03-AUG-2000 (first entry) 
XX 

DE Human aspartyl protease 1 (Aspl) nucleotide sequence. 
XX 

KW Aspartyl protease; aspartase; amyloid precursor protein; APP; Asp 1; 

KW Alzheimer ! s disease; beta secretase site; ss. 

XX 

OS Homo sapiens. 



XX 

PN WO200017369-A2 . 
XX 

PD 30-MAR-2000. 
XX 

PF 23-SEP-1999; 99WO-US020881 . 
XX 

PR 24-SEP-1998; 98US-0101594P . 
XX 

PA (PHAA ) PHARMACIA & UPJOHN CO. 
XX 

PI Gurney ME, Bienkowski MJ, Heinrikson RL, Parodi LA, Yan R; 
XX 

DR WPI; 2000-303209/26. 

DR P-PSDB; AAY88424. 
XX 

PT New enzyme designated human aspartase useful in research into Alzheimer 1 s 

PT Disease is capable of cleaving amyloid protein precursor at the beta 

PT secretase site to produce amyloid beta peptide. 
XX 

PS Claim 11; Fig 1; 183pp; English. 
XX 

CC This sequence represents the human aspartyl protease nucleotide sequence. 

CC The invention relates to a protease capable of cleaving the beta 

CC secretase site of amyloid precursor protein (APP) . The protease contains 

CC a sequence encoding the amino acid sequence DTG and a sequence encoding 

CC DSG or DTG separated by 100-300 amino acids. When mutated the APP gene 

CC causes an autosomal dominant form of Alzheimer's disease. APP localises 

CC to the cell surface membrane and have a single C-terminal transmembrane 

CC domain. Proteolytic processing of APP produces the amyloid beta protein, 

CC which is possibly very important in Alzheimer's disease. The invention 

CC includes a nucleotide sequence encoding the protease, a vector containing 

CC the nucleotide sequence, and a cell line comprising the vector. Methods 

CC for screening for inhibitors of beta secretase activity are also given in 

CC the invention. The human aspartase protein and nucleotide sequences and 

CC the methods for identifying inhibitors of the protease, are useful in the 

CC treatment of and research in to Alzheimer's disease 
XX 

SQ Sequence 1804 BP; 397 A; 520 C; 458 G; 429 T; 0 U; 0 Other; 

Query Match 100.0%; Score 1804; DB 3; Length 1804; 
Best Local Similarity 100.0%; Pred. No. 0; 

Matches 1804; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

Qy 61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 120 

I | | I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I 

Db 61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 12 0 

Qy 121 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 

Db 121 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 18 0 



181 



GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 



240 



Db 


181 


Qy 


241 


Db 


241 


Qy 


301 


Db 


301 


Qy 


361 


Db 


361 


Qy 


421 


Db 


421 


Qy 


481 


Db 


481 


Qy 


541 


Db 


541 


Qy 


601 


Db 


601 


Qy 


661 


Db 


661 


Qy 


721 


Db 


721 


Qy 


781 


Db 


781 


Qy 


841 


Db 


841 


Qy 


Q Pi 1 


Db 


901 


Qy 


961 


Db 


961 


Qy 


1021 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I II I I I I I I I I M I I 

GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 240 

GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 300 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I M I I I I I I I I I I I I I I I I I I I I I I 

GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 300 

C C C C C GCAGAAG CT ACAGAT T CT C GTT GACACT GGAAGC AGTAACT T T GCC GT G GCAGGA 360 

I I I M I I I I I I I II I I M I I I I I I II I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I 

C CC C C GCAGAAG CT AC AGAT T CT C GT T GACACT GGAAG C AGTAACT T T GC C GT GGC AGGA 360 

AC C C C GC ACT C CT ACAT AG AC AC GT ACT TT GACACAGAGAGGT CT AGCAC AT AC C GCT C C 420 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I M I I II 
AC C C C GC ACT C C T ACAT AGACAC GT ACT TT GACACAGAGAG GT CT AGCACAT AC C GCT C C 420 

AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 4 80 

I I I M | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 480 

GAC CT C GT C AC CAT C C C CAAAGGCT T CAATACTT CTT T T CT T GT CAAC AT T G C C ACT AT T 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 

GAC CT C GT C AC CAT C C C CAAAGGCT T CAATACTT CTT T T CT T GT CAAC AT T GC CACT ATT 54 0 
T T T GAAT CAGAGAATT T CTTTTTGCCT GGGATT AAATGGAAT GGAAT ACTT GGC CT AGCT 600 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I 

T T T GAAT C AGAGAAT TT CTTTTTGCCT GGGATT AAAT GGAAT G GAAT ACTT GGC CT AGCT 600 
TAT GC C ACACT T GC CAAGC C AT CAAGTT CT CT G GAGACCT T CT T C GACT C C CT GGT GACA 660 

I I I I I I I I I I I I I I M I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

TATGCCACACTTGCCAAGCCATCAAGTTCTCTGGAGACCTTCTTCGACTCCCTGGTGACA 660 

CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 72 0 

I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 72 0 

GGAT CT GGGAC CAAC GGAGGT AGT CT T GT CT T GG GT GGAATT GAAC CAAGT T T GT AT AAA 7 8 0 

I | | | | | | I I I I I I I I I I II I I I I I I I II I II I I I I I I I I I I I I I I I M I I I I I I I I I I I I 

GGATCTGGGACCAACGGAGGTAGTCTTGTCTTGGGTGGAATTGAACCAAGTTTGTATAAA 7 8 0 

GGAGACAT CT GGTATACCCCTATTAAGGAAGAGT GGTACTACCAGATAGAAATT CT GAAA 84 0 

I | | || | | || | I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 

GGAGACAT CT GGT AT AC C C CT AT T AAGGAAGAGT G GT ACT AC CAGAT AGAAAT T CT GAAA 8 4 0 

TT GGAAAT T GGAGGC CAAAGC CT TAAT CT GGACT GCAGAGAGT AT AAC GC AGACAAGGC C 900 

I | | | M | | | I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I II 

TT GGAAAT T G GAGG C CAAAG C CT T AAT CT G GACT GCAGAGAGT AT AAC GCAGACAAGGC C 90 0 

ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 

ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 



I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I 



CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 108 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



1021 C AGCT G G C GT G CT GGAC GAAT T C G GAAACAC CTT GGTCTT ACT T CC CTAAAAT CT C CAT C 108 0 

1081 TACCTGAGAGATGAGAACTCCAGCAGGTCATTCCGTATCACAATCCTGCCTCAGCTTTAC 114 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I M I I I I 

1081 TACCTGAGAGATGAGAACTCCAGCAGGTCATTCCGTATCACAATCCTGCCTCAGCTTTAC 1140 

1141 ATTCAGCCCATGATGGGGGCCGGCCTGAATTATGAATGTTACCGATTCGGCATTTCCCCA 1200 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I M I I I I I I I I I I I I I I I I I I I I 
1141 ATTCAGCCCATGATGGGGGCCGGCCTGAATTATGAATGTTACCGATTCGGCATTTCCCCA 1200 

1201 T C CACAAAT GC G CT G GT GAT C G GT GC C AC GGT GAT GGAGGGCT TCT ACGT CAT CTT C GAC 1260 

I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I 

1201 T C CACAAAT GC G CT G GT GAT C G GT GC C AC GGT GAT GGAGGGCT T CT ACGT CATCTT C GAC 1260 

12 61 AGAGC C C AGAAGAGGGT G GGCT T C GCAG C GAGCC CCT GTGCAGAAAT T GCAGGT GCT GCA 132 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I M 

1261 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 1320 

1321 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I 
1321 GT GT CT GAAATT T CCGGGCCTTT CT CAAC AGAGGAT GT AGCCAGCAACT GT GTCCCCGCT 138 0 

1381 C AGT CT T T GAGC GAGC C CAT T T T GT G GAT T GT GT CCTAT GCGCT CATGAGCGT CT GT GGA 1440 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

1381 CAGT CT T T GAGC GAGC C CAT T TT GT G GAT T GT GT C CT AT GCGCT CAT GAGCGT CTGT GGA 1440 

1441 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 

I I I I I I I I I I I I I I I I I I I I M I I II I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I 

1441 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 

1501 C GT GAC C CT GAGGT C GT CAAT GAT GAGT CCTCTCTGGT CAGACAT CGCT GGAAAT GAAT A 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I II I I I I I I I I I 
1501 C GT GAC C CT GAGGT C GT CAAT GAT GAGT C CT CT CT GGT CAGACATCGCT GGAAAT GAAT A 1560 

1561 G C CAGG C CT GAC CT CAAGCAAC CAT GAACT C AGCT AT T AAGAAAAT CACATTT CCAGGGC 1620 

I I I I I I I I I I I M I I I I I I I I I I I I I I M II I I II I I I I I I I I I I I I II I I I I I II II I I 

1561 GCCAGGCCT GACCT CAAGCAAC CAT GAACT CAGCTATTAAGAAAATCACATTTCCAGGGC 1620 

1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 1680 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I 

1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 1680 

1681 GCTCCCAGATGCCTTCTAGATTCACTGTCTTTTGATTCTTGATTTTCAAGCTTTCAAATC 1740 

I I I I I I II I I I I I I M I I II I I I I I I I I I M I I I I I I I I I I I I I II I I II I I I I I I I I I I 

1681 GCTCCCAGATGCCTTCTAGATTCACTGTCTTTTGATTCTTGATTTTCAAGCTTTCAAATC 1740 

1741 CT C C CT ACT T C CAAGAAAAATAAT TAAAAAAAAAACTT CAT T CT AAAC CAAAAAAAAAAA 1800 

M I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I 
17 41 CT C C CT ACT T C CAAGAAAAATAAT TAAAAAAAAAACT T CAT T CT AAAC CAAAAAAAAAAA 1800 

1801 AAAA 1804 
I I I I 

1801 AAAA 1804 



ID AAS11701 standard; DMA; 1804 BP. 
XX 

AC AAS11701; 
XX 

DT 24-OCT-2001 (first entry) 
XX 

DE DNA encoding human aspartyl protease 1 (Asp-1) . 
XX 

KW Human; aspartyl protease 1; Asp-1; nootropic; neuroprotective; 

KW aspartyl protease 2; Asp2; amyloid protein precursor; APP; 

KW beta-secretase; Alzheimer's disease; ds . 
XX 

OS Homo sapiens. 
XX 

FH Key Location/Qualifiers 

FT CDS 1. .1557 

FT /*tag= a 

FT /product= "Aspartyl protease-1 (Asp-1) " 
XX 

PN WO200149097-A2. 
XX 

PD 12-JUL-2001. 
XX 

PF 09-MAY-2001; 2001WO-IB0007 97 . 
XX 

PR 09-MAY-2001; 2001WO-IB000797 . 
XX 

PA (BIEN/) BIENKOWSKI M J. 

PA (GURN/) GURNEY M E. 

PA (HEIN/) HEINRIKSON R L. 

PA (PARO/) PARODI L A. 

PA (YANR/) YAN R. 

XX 

PI Bienkowski MJ, Gurney ME, Heinrikson RL, Parodi LA, Yan R; 
XX 

DR WPI; 2001-502548/55. 

DR P-PSDB; AAU07201. 
XX 

PT Novel purified polypeptide comprising fragment of mammalian aspartyl 

PT protease 2, lacking Asp2 transmembrane domain and retaining beta 

PT secretase activity of Asp2 useful for identifying inhibitors of Asp2 

PT activity. 

XX 

PS Example 2; Fig 1; 185pp; English. 
XX 

CC The invention relates to a novel purified polypeptide comprising a 

CC fragment of mammalian aspartyl protease 2 (Asp2) protein which lacks the 

CC Asp2 transmembrane domain and the Asp2 protein, and where the polypeptide 

CC and the fragment retain the beta-secretase activity of the mammalian Asp2 

CC protein. Also included is an isoform of amyloid protein precursor (APP) 

CC comprising the amino acid sequence of a APP or its fragment containing an 

CC APP cleavage site recognisable by a mammalian beta-secretase, and further 

CC comprising two lysine residues at the carboxyl terminus of the amino acid 

CC sequence of the mammalian APP or APP fragment. The polypeptides are used 

CC for assaying for modulators of beta-secretase activity; identifying 

CC agents that inhibit the APP processing activity of human Asp2 aspartyl 

CC protease (Hu-Asp2) ; identifying agents that modulate the activity of Asp2 



CC ; and for reducing cellular production of amyloid beta (Abeta) from APP. 

CC Agents identified by the above methods are useful for treating 

CC Alzheimer's disease; and for identifying modulators of amyloid-beta 

CC (Abeta) peptide production, for use in designing therapeutics for the 

CC treatment or prevention of Alzheimer's disease. Probes and primers 

CC derived from Asp nucleic acid sequences are useful for detecting Hu-Asp 

CC nucleic acids in in vitro assays and in Northern and Southern blots. The 

CC present sequence represents the coding sequence of human Asp-1 

XX 

SQ Sequence 1804 BP; 397 A; 520 C; 458 G; 429 T; 0 U; 0 Other; 

Query Match 100.0%; Score 1804; DB 4; Length 1804; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 1804; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

Qy 61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 120 

Qy 121 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 18 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 121 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 18 0 

Qy 181 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 24 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 181 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 24 0 

Qy 241 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 241 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 300 

Qy 301 C C C CCGC AGAAGCT ACAGAT T CT C GT T GAC ACT GGAAGCAGTAACT TT GC C GT GGCAGGA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 301 C C C CC GCAGAAG CT ACAGAT T CT CGT T GAC ACT G GAAGCAGTAACT TT G C C GT GGCAGGA 360 

Qy 361 ACCCCGCACT CCTACATAGACACGTACTTT GACACAGAGAGGT CTAGCACATACCGCT CC 420 

I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 361 ACCCCGCACT CCTACATAGACACGTACTTT GACACAGAGAGGT CTAGCACATACCGCT C C 420 

Qy 421 AAG GGCT TT GAC GT C ACAGT GAAGT AC ACACAAG GAAG CT GGAC GGGCTT C GT T GG G GAA 4 80 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I 

Db 421 AAG GGCT TT GAC GTCACAGTGAAGTACACACAAG GAAG CT GGAC GGGCTT CGTTGGGGAA 4 80 

Qy 481 GAC CT C GT CACCAT C C C CAAAGGCTT CAAT ACT TCTTTTCTTGT CAAC AT T GC CACT AT T 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I II I I I I I I I I I I I I I I I I 

Db 481 GAC CT C GT C AC CAT C C C CAAAGGCTT CAAT ACT TCTTTTCTTGT CAACAT T GC CACT AT T 540 

Qy 541 TTTGAATCAGAGAATTTCTTTTTGCCTGGGATTAAATGGAATGGAATACTTGGCCTAGCT 600 

I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 541 T T T GAAT C AGAGAAT TTCTTTTTGCCT GGGATT AAAT G GAAT GGAAT ACT T GGCCT AG CT 600 

Qy 601 TAT GC C AC ACTT GC CAAGC C AT CAAGT T CT CT GGAGACCT T CT T C GACT C C CT GGT GAC A 660 

I I I I I I I I I I I I I I I I I II I I II I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 601 TATGCCACACTTGCCAAGCCATCAAGTTCTCTGGAGACCTTCTTCGACTCCCTGGTGACA 660 

Qy 661 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 72 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I . 
Db 661 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 720 

Qy 721 GGAT CT GGGAC CAAC GGAGGT AGT C T T GT CT T GGGT GGAAT T GAAC CAAGT T T GTAT AAA 78 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I 

Db 721 GGAT CT GGGAC CAAC GGAG GT AGT CT T GT CT T GGGT GGAAT T GAAC CAAGT T T GTAT AAA 780 

Qy 781 GGAGACATCT GGTATACC CCTATTAAGGAAGAGT GGTACT ACCAGATAGAAATTCTGAAA 84 0 

I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

Db 781 GGAGACATCT GGT ATACCCCTATT AAGGAAGAGT GGTACTACCAGATAGAAATT CTGAAA 84 0 

Qy 841 T T G GAAATT GGAGGC CAAAG C CT T AATCT GGACT GCAGAGAGT ATAAC GC AGACAAG G C C 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 841 T T GGAAATT GGAGGC CAAAG C CT TAAT CT GGAC T GCAGAGAGT ATAAC GCAGACAAGG C C 900 

Qy 901 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 901 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 

Qy 961 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1020 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 961 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1020 

Qy 1021 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1021 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 1080 

Qy 1081 T AC CT GAGAGAT GAGAACT C C AGC AGGT CAT T C C GTAT C ACAAT C CT GC CT CAGCT TT AC 1140 

I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1081 T AC CT GAGAGAT GAGAACT C CAG C AGGT CAT T C C GTAT C ACAAT C CT GC CT CAGCT T T AC 1140 

Qy 1141 AT T CAG CC CAT GAT GGGGGC C GGC CT GAATT AT GAAT GT T AC C GATT C GGC AT T T CC C CA 12 00 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 

Db 1141 AT T CAGCC CAT GAT GGGGGC C GGC CT GAATT AT GAAT GT T AC C GATT C GGC ATT T CC C CA 12 00 

Qy 1201 TCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGAC 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1201 T C C ACAAAT GC GCT GGT GAT C GGT GC C AC GGT GAT GGAGGG CT T CT AC GT CAT CTT C GAC 1260 

Qy 1261 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1261 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 1320 

Qy 1321 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1321 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1380 

Qy 1381 CAGT CT TT GAGC GAGCC CAT TTTGT GGAT TGTGTCCTATGC GCT CAT GAGCGTCTGTGGA 1440 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1381 CAGT CTTT GAGC GAGCCCATTTTGTGGATTGTGTCCTATGCGCT CAT GAGCGTCTGTGGA 1440 

Qy 1441 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

Db 1441 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 



Qy 1501 C GT GACCC T GAG GT C GT CAAT GAT GAGT CCTCTCTGGT CAGAC AT C GCT GGAAAT GAAT A 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I M I I I M I I I I I I I I 
Db 1501 C GT GACCCT GAG GT C GT CAAT GAT GAGT C CT CT CT G GT CAGAC AT C GCT GGAAAT GAAT A 1560 

Qy 1561 GC CAGGCCT GACCT CAAGCAACCATGAACT CAGCTATTAAGAAAAT CACATTTCCAGGGC 1620 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I M I I I I I I I I I I I II II I I I I I I I I I I I M 
Db 1561 GC CAGGCCT GAC CT CAAGCAAC CAT GAACT C AGCT AT T AAGAAAAT CACATT T C C AG GGC 1620 

Qy 1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 168 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I i I I I I I I I II I 

Db 1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 1680 

Qy 1681 GCT C CCAGAT GC CT T CT AGATT CACTGT CT T T T GAT T CT T GAT T T T CAAGCT TT CAAAT C 174 0 

I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I M I I M I I I I 

Db 1681 GCT C C CAGAT GC CTT CT AGAT T C ACT GT CT T T T GAT T CT T GAT T T T CAAGCTT T CAAAT C 1740 

Qy 1741 CT C C CT ACT T C CAAGAAAAAT AAT T AAAAAAAAAACT T CAT T CTAAAC CAAAAAAAAAAA 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1741 CT C C CTACT T C CAAGAAAAAT AAT T AAAAAAAAAACT T CAT T CTAAAC CAAAAAAAAAAA 18 00 

Qy 1801 AAAA 1804 

I I I I 

Db 1801 AAAA 1804 
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XX 
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XX 
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XX 
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(PHAA ) PHARMACIA & UPJOHN CO. 

Bienkowkski MJ, Gurney M; 

WPI; 2001-444208/48. 
P-PSDB; AAE10628. 

Polypeptide comprising fragments of human aspartyl protease with amyloid 
precursor protein processing activity and alpha-secretase activity, for 
identifying modulators useful in treating Alzheimer's disease. 

Claim 30; Fig 1; 187pp; English. 

The patent discloses human aspartyl protease 1 (hu-Aspl) or modified Aspl 
proteins which lack transmembrane domain or amino terminal domain or 
cytoplasmic domain and retains alpha-secretase activity and amyloid 
protein precursor (APP) processing activity. The proteins of the 
invention are useful for assaying hu-Aspl alpha-secretase activity, which 
in turn is useful for identifying modulators of hu-Aspl alpha-secretase 
activity, where modulators that increase hu-Aspl alpha-secretase activity 
are useful for treating Alzheimer's disease (AD) which causes progressive 
dementia with consequent formation of amyloid plaques, neurofibrillary 
tangles, gliosis and neuronal loss. Hu-Aspl protease substrate is useful 
for assaying hu-Aspl proteolytic activity, by contacting hu-Aspl protein 
with the substrate under acidic conditions and determining the level of 
hu-Aspl proteolytic activity. The present sequence is a cDNA encoding 
human Aspl protein. Aspl gene is localised on chromosome 21 

Sequence 1804 BP; 397 A; 520 C; 458 G; 429 T; 0 U; 0 Other; 



Query Match 100.0%; Score 1804; DB 4; Length 1804; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 1804; Conservative 0; Mismatches 0; Indels 0; 



Gaps 



0; 



Qy 


1 


Db 


1 


Qy 


61 


Db 


61 


Qy 


121 


Db 


121 


Qy 


181 


Db 


181 



ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 

I I I I I I I I M I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 

ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 

GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 

CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 

I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I M I I I I M I I I I I I I I 

CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 



60 



60 



120 



120 



180 



180 



GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 240 

II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I 

GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 240 



Qy 241 GT AGACAAC C T GCAG GGGGACT CT G G C C GC GG CT ACTACCT GGAGAT GCT GAT CGGGAC C 300 

I I I I I I I I I I I I I I I I I I ! II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M II I I 
Db 241 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 300 

Qy 301 CCCCC GCAGAAGCT ACAGATT CT CGTT GACACTGGAAGCAGTAACTTTGCCGTGGCAGGA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 301 CCCCC GCAGAAGCT AC AGATT C T C GT T GACACT GGAAGCAGTAACT TT GCCGT GGCAG GA 360 

Qy 361 AC C C C GCACT C CT ACAT AGACAC GT ACT T T GACACAGAGAGGT CT AGCACAT ACCGCT C C 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I II I 

Db 361 ACCCC GCACT CCTACATAGACACGTACTTT GACACAGAGAGGTCTAGCACAT ACCGCT CC 420 

Qy 421 AAGGG CT T T GAC GT C AC AGT GAAGT AC AC ACAAGGAAGCT GGAC G GGCT T C GT T GG GGAA 480 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 421 AAG GGCT T T GAC GT CACAGT GAAGT AC AC ACAAGGAAGCT GGAC G GGCT T C GT T GGGGAA 480 

Qy 481 GACCTCGTCACCATCCCCAAAGGCTTCAATACTTCTTTTCTTGTCAACATTGCCACTATT 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4 81 GACCTCGTCACCATCCCCAAAGGCTTCAATACTTCTTTTCTTGTCAACATTGCCACTATT 540 

Qy 541 T T T GAAT C AGAGAAT TTCTTTTTGCCT GGGATT AAAT GGAAT GGAATACT T GGCCT AGCT 600 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I IE 
Db 541 TTT GAAT CAGAGAATT T CTTTTT GCCT GGGATTAAATGGAATGGAATACTT GGCCT AGCT 600 

Qy 601 TATGCCACACTTGCCAAGCCATCAAGTTCTCTGGAGACCTTCTTCGACTCCCTGGTGACA 660 

I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 601 TAT G C C AC ACT T G C C AAGC CAT CAAGT T CT CT GGAGAC CTT CT T C GACT C C CT GGT GAC A 660 

Qy 661 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 720 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I 

Db 661 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 720 

Qy 721 GGAT CTGGGACCAAC GGAGGT AGT CTT GT CTT GGGTGGAATT GAACCAAGTTT GTATAAA 780 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II 

Db 721 GGATCT GG GAC CAAC GGAGGT AGT CTT GT CTT GGGTGGAATT GAACCAAGTTT GTATAAA 780 

Qy 781 GGAGACAT CT G GT AT AC C C CT ATTAAGGAAGAGT GGT ACT ACCAGAT AGAAATT CT GAAA 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

Db 781 GGAGACAT CT GGT AT AC C C CT ATTAAGGAAGAGT G GT ACT AC CAGAT AGAAATT CT GAAA 840 

Qy 841 TT GGAAAT T GGAG GC CAAAGC CT T AAT CT GGACT GC AGAGAGT AT AAC GCAGACAAGGC C 900 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I 

Db 841 T T GGAAAT T G GAGGC CAAAGC CT T AAT CT G GACT GCAGAGAGTATAAC GCAGACAAGGCC 900 

Qy 901 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 901 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 

Qy 961 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

Db 961 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1020 

Qy 1021 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

Db 1021 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 1080 



Qy 1081 T AC CT GAGAGAT GAGAACT C C AGCAGGT CAT T C C GT AT CACAAT C CT G CCT C AGCT TT AC 114 0 

M I I I I I I I I I M I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I M I I I I I I I I I 
Db 1081 T AC CT GAGAGAT GAGAACT C C AGCAGGT CAT T C C GTAT CACAAT CCT GCCT C AGCT T T AC 1140 

Qy 1141 ATT C AGC CCAT GAT GGGGGCCGGCCT GAAT TAT GAAT GT TAC C GAT T C GGC AT T T C C C C A 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1141 ATT C AGC C CAT GAT GGGGGCCGGCCT GAAT TAT GAAT GT TAC C GAT T C GGC AT T T C C C C A 1200 

Qy 1201 TCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGAC 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I M I 

Db 1201 TCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGAC 1260 

Qy 1261 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I II I I I 

Db 12 61 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 132 0 

Qy 1321 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1321 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 138 0 

Qy 1381 CAGT CT T T GAG C GAGC CCAT TT T GT GGAT T GT GT C CT AT GC GCT CAT GAGC GT CT GT GGA 144 0 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1381 CAGT CT T T GAG C GAGC C CATT T T GT GGAT T GTGTCCTATGC GCT CAT GAGC GTCTGT GGA 144 0 

Qy 1441 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 1441 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 

Qy 1501 C GT GAC C CT GAGGT CGT CAAT GAT GAGT CCT CT CT G GT C AGACAT C GCT GGAAAT GAAT A 1560 

I I I I I I I I I I I II I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I M I II I I I I 
Db 1501 C GT GAC CCT GAGGT CGT CAAT GAT GAGT C CT CT CT GGT C AGACAT C GCT GGAAAT GAAT A 1560 

Qy 1561 GCCAGG C CT GAC CT CAAGCAAC CAT GAACT C AGCT ATT AAGAAAAT C ACAT T T C C AGGGC 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I 

Db 1561 G CCAGG C CT GACCT CAAGCAAC CAT GAACT C AGCT ATTAAGAAAAT C AC AT T T C C AG GGC 1620 

Qy 1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 1680 

I I I I I I I I I M I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 1680 

Qy 1681 GCTCCCAGATGCCTTCTAGATTCACTGTCTTTTGATTCTTGATTTTCAAGCTTTCAAATC 1740 

I I I I I II I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I M I I I I I I I I I I I I I I I 

Db 1681 GCT C C C AGAT GC CTT CT AGAT T C ACT GT CT T T T GAT T CTT GAT T T T CAAGCT T T CAAAT C 1740 

Qy 1741 CT CC CT ACT T C CAAGAAAAATAAT T AAAAAAAAAACT T CAT T CTAAAC CAAAAAAAAAAA 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1741 CT CC CT ACT T C CAAGAAAAATAAT TAAAAAAAAAACT T CAT T CTAAAC CAAAAAAAAAAA 1800 

Qy . 1801 AAAA 1804 

I I I I 

Db 1801 AAAA 1804 
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FT sig_peptide 1. .60 

FT /*tag= b 

FT mat_peptide 61. .1554 

FT /*tag- c 

FT /product= "Mature human aspartyl protease 1 (Hu-Aspl)" 

XX 

PN WO200150829-A2. 
XX 

PD 19-JUL-2001. 
XX 

PF 09-MAY-2001; 2001WO-IB000799 . 
XX 

PR 09-MAY-2001; 2001WO-IB0007 99 . 
XX 

PA (BIEN/) BIENKOWSKI M J. 

PA (GURN/) GURNEY ME. 

PA (HEIN/) HEINRIKSON R L. 

PA (PARO/) PARODI L A. 

PA (YANR/) YAN R. 

XX 

PI Bienkowski MJ, Gurney ME, Heinrikson RL, Parodi LA, Yan R; 
XX 

DR WPI; 2001-483072/52. 

DR P-PSDB; AAE06858. 
XX 

PT Novel purified polypeptide comprising fragment of mammalian aspartyl 

PT protease 2, lacking Asp2 transmembrane domain and retaining beta 

PT secretase activity of Asp2 useful for identifying inhibitors of Asp2 

PT activity. 

XX 

PS Example 2; Fig 1; 185pp; English. 
XX 

CC The invention relates to human aspartyl proteases (Hu-Asp) , beta-amyloid 

CC precursor protein (APP) isoforms and their corresponding DNA molecules . 

CC Human aspartyl proteases can act as beta-secretase proteases useful for 

CC treating Alzheimer f s disease. APP isoforms are useful for identifying 

CC modulators of amyloid-beta peptide production, for use in designing 

CC therapeutics for the treatment and prevention of Alzheimer's disease, 

CC dementia, formation of amyloid plaques, neurofibrillary tangles, gliosis 

CC and neuronal loss. APP isoforms are also used in methods for identifying 



CC inhibitors and modulators of human Asp2 activity. The invention relates 

CC to a method for identifying agents that modulate the activity of human 

CC aspartyl protease Asp2 . Amyloid-beta peptides obtained from APP are used 

CC as a means to screen in cellular assays for the inhibitors of beta- and 

CC gamma- secretase. Hu-Asp DNA fragments are useful as probes or primers in 

CC polymerase chain reactions (PCR) . The probes are useful for detecting Hu- 

CC Asp nucleic acids in in vitro assays and in Northern and Southern blots. 

CC The present cDNA sequence encodes human aspartyl protease 1 (Hu-Aspl) . Hu 

CC -Asp 1 gene is localised on chromosome 21 
XX 

SQ Sequence 1804 BP; 397 A; 520 C; 458 G; 429 T; 0 U; 0 Other; 

Query Match 100.0%; Score 1804; DB 4; Length 1804; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 18 04; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 120 

I M I I I M M I I I M I I I II I I I I I I I M I I I I I I I I I I I I II I I II I M I I I I I I I II I 

GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 12 0 

CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I M 

CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 180 

GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 24 0 

I M I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 2 40 

GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 300 

I I I M I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 300 

C C C C C GC AGAAGCT ACAGAT T CT C GTT GACACT GGAAGCAGTAACT T T GC C GTGGCAGGA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

C C C C C G CAGAAGCT AC AGAT T CT C GT T GACACT GGAAG CAGTAACT T T GC C GT GGCAGGA 360 

AC C C C GC ACT CCT AC AT AGACAC GT ACT TT GAC AC AGAGAG GT CT AGCAC AT AC CGCT C C 42 0 

I | I | I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

ACCCCGCACTCCTACAT AGACAC GTACTTT GACACAGAGAGGT CTAGCACATACCGCT CC 42 0 

AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 4 8 0 

GAC CT C GT CACC AT C C C CAAAGG CT T CAAT ACTT CT TT T CT T GT CAACAT T GC CACT AT T 540 

I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GAC CT C GT C AC CAT C C C CAAAGGCTT CAAT ACTT CT T T T CT T GT CAACAT T GC CACT AT T 54 0 

T TT GAAT C AGAGAAT TTCTTTTTGCCT GGGAT T AAAT GGAAT GGAAT AC T T G GC CT AG CT 600 

I M II I I I I I I I I I I I I II I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TTTGAATCAGAGAATTTCTTTTTGCCTGGGATTAAAT GGAAT GGAAT ACTT GGCCTAGCT 600 



Qy 


1 


Db 


1 


Qy 


61 


Db 


61 


Qy 


121 


Db 


121 


Qy 


181 


Db 


181 


Qy 


241 


Db 


241 


Qy 


301 


Db 


301 


Qy 


361 


Db 


361 


Qy 


421 


Db 


421 


Qy 


481 


Db 


481 


Qy 


541 


Db 


541 



Qy 



601 TATGCCACACTTGCCAAGCCATCAAGTTCTCTGGAGACCTTCTTCGACTCCCTGGTGACA 660 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 

Db 601 TAT G CC AC ACT T GC CAAGC CAT CAAGT T CT CT GGAGAC CT TCT T C GACT C C CT G GT GAC A 660 

Qy 661 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 661 CAAGCAAAC AT C C C CAAC GT T T T CT C CAT GCAGAT GT GT GGAG CCGGCTTGCCCGTTGCT 720 

Qy 721 G GAT CT GGGAC CAAC GGAGGT AGT CTT GT CT T GGGT GGAATT GAAC CAAGT T T GT AT AAA 780 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 721 GGAT CT GGGAC CAAC GGAGGT AGT CTT GT C T T G GGT GGAATT GAAC CAAGT T T GT AT AAA 78 0 

Qy 781 GGAGAC AT CT GGT AT AC C CC T AT TAAGGAAGAGT G GT ACT AC CAGAT AGAAAT T CT GAAA 840 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I 

Db 7 81 GGAGAC AT CT GGT AT AC C CC T AT TAAGGAAGAGT G GT ACT AC CAGAT AGAAAT T CT GAAA 84 0 

Qy 841 T T GGAAAT T GGAG GC CAAAGC CT T AAT CT GGAC T GC AGAGAGT ATAACGC AGACAAGGC C 900 

I I I I II I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I 

Db 841 T T GGAAAT T GGAG GC CAAAGC CT T AAT CT GGAC T GC AGAGAGT AT AAC GC AGACAAGGC C 900 

Qy 901 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 901 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 

Qy 961 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1020 

II I I I I II I I I I I I I I M I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I 

Db 961 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 102 0 

Qy 1021 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 108 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 1021 CAGCT G GC GT GCT GGAC GAATTCGGAAACAC CTT GGT CT TACT TCCCTAAAATCTC CATC 108 0 

Qy 1081 T AC CT GAGAGAT GAGAACT C CAG C AGGT CAT T C CGT AT C ACAAT C CT GC CT CAGCT T T AC 114 0 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

Db 1081 T AC CT GAGAGAT GAGAACT C CAG CAG GT CAT T C CGT AT C ACAAT C CT GC CT CAGCT T T AC 1140 

Qy 1141 ATTCAGCCCATGATGGGGGCCGGCCTGAATTATGAATGTTACCGATTCGGCATTTCCCCA 1200 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1141 AT T CAGC C CAT GAT G GGGGC C GGC CT GAATT AT GAAT GT T AC CGAT T CGGC AT T T C C C C A 1200 

Qy 1201 T C CACAAAT G C GCT G GT GAT C GGT GC C AC G GT GAT GGAGGGCT T CT ACGT CAT CTT C GAC 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1201 TCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGAC 1260 

Qy 1261 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 1320 

I I I I I I I M I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 12 61 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 132 0 

Qy 1321 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1380 

II I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1321 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 138 0 

Qy 1381 C AGT CT TT GAGCGAGC C C ATT T T GT G GAT T GT GT C CT AT GCGCT CAT GAGC GT C TGT GGA 144 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 1381 CAGT CT T T GAGC GAG C C C ATT T T GT G GAT T GT GT C CT AT GCGCT CAT GAGC GT C TGT GGA 144 0 

Qy 1441 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I 



Db 



1441 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 



Qy 1501 C GT GAC C CT GAG GT C GT CAAT GAT GAGT CCTCTCTGGT CAGACAT C GCT GGAAAT GAAT A 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I 
Db 1501 C GT GAC C CT GAG GT C GT CAAT GAT GAGT CCTCTCTGGT CAGACAT C GCT GGAAAT GAAT A 1560 

Qy 1561 G C CAGGC CT GAC C T CAAGC AACCAT GAACT C AGCT AT TAAGAAAAT C AC AT T T C C AGGGC 162 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1561 G CCAGGC CT GAC CT CAAG CAAC CAT GAACT C AGCT AT TAAGAAAAT C AC AT T T C C AGGGC 162 0 

Qy 1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 1680 

M I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I M I I I I I 

Db 1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 1680 

Qy 1681 GCT C C C AGAT G C CTT CT AGAT T CACT GT CT TT T GAT TCT T GAT T T T CAAGCT T T CAAAT C 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1681 GCT C C C AGAT G C CTT CT AGAT T CACT GT CT TT T GAT TCT T GAT T T T CAAGCT T T CAAAT C 174 0 

o 

Qy 1741 CT C C CTAC T T C CAAGAAAAATAATTAAAAAAAAAACTT C AT T CT AAACCAAAAAAAAAAA 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1741 CT C C CT ACT T C CAAGAAAAAT AAT TAAAAAAAAAACTT CAT T CT AAACCAAAAAAAAAAA 1800 

Qy 1801 AAAA 1804 

I I I I 

Db 1801 AAAA 1804 



RESULT 5 
AAD06738 

ID AAD06738 standard; cDNA; 1804 BP. 
XX 

AC AAD06738; 
XX 

DT 10-AUG-2001 (first entry) 
XX 

DE Human aspartyl protease 1 {Asp 1) cDNA. 
XX 

KW Human; alpha-secretase ; amyloid precursor protein; APP; therapy; 

KW Alzheimer's disease; antialzheimer 1 s ; aspartyl protease 1; Asp 1; 

KW beta-secretase; chromosome 21; ss. 
XX 

OS Homo sapiens. 



XX 

FH Key Location/Qualif iers 

FT CDS 1. ,1557 

FT /*tag= a 

FT /product^ "Human aspartyl protease 1 (Asp 1) " 

FT sig_peptide 1. .60 

FT /*tag= b 

FT sig_peptide 64. .186 

FT /*tag= c 

FT /note- "Pre-pro-peptide" 

FT sig_peptide 67. .186 

FT /*tag= d 

FT /note= "Pro-peptide" 

FT mat_j>eptide 187. .1554 

FT /*tag^ e 



FT /product= "Human mature aspartyl protease 1 (Asp 1) " 

XX 

PN WO200123533-A2. 
XX 

PD 05-APR-2001. 
XX 

PF 22-SEP-2000; 2000WO-US026080 . 
XX 

PR 23-SEP-1999; 99US-0155493P . 

99WO-US020881. 
99US-00416901. 



PR 23-SEP-1999 
PR 13-OCT-1999 



PR 06-DEC-1999; 99US-0169232P . 
XX 

PA (PHAA ) PHARMACIA & UPJOHN CO. 
XX 

PI Gurney M f Bienkowski MJ; 
XX 

DR WPI; 2001-290516/30. 

DR P-PSDB; AAE02580. 
XX 

PT Enzymes that cleave the alpha-secretase site of the amyloid precursor 

PT protein, useful for the treatment of Alzheimer f s disease. 

XX 

PS Example 2; Fig 1; 189pp; English. 
XX 

CC The present invention relates to enzymes for cleaving the alpha- 

-CC secretase site of the amyloid precursor protein (APP) and methods of 

CC identifying those enzymes. The methods may be used to identify enzymes 

CC that may be used to cleave the alpha-secretase cleavage site of the APP 

CC protein. The enzymes may be used to treat or modulate the progress of 

CC Alzheimer's disease. The present sequence is human aspartyl protease 1 

CC (Asp 1) cDNA. Asp 1 has alpha-secretase protease and beta-secretase 

CC protease activities. Asp 1 gene is located on chromosome 21 
XX 

SQ Sequence 1804 BP; 397 A; 520 C; 458 G; 429 T; 0 U; 0 Other; 

Query Match 100.0%; Score 1804; DB 4; Length 1804; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 1804; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I ! I I I I I I I I I 

Db 1 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

Qy 61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 12 0 

Qy 121 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 180 

I I I I I I I I I I I I I I I i I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

Db 121 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 18 0 

Qy 181 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 181 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 240 



QY 



241 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 300 



241 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 300 

301 C C C C C GC AGAAGC T AC AG AT T CT C GT T GACACTGGAAGC AGTAACTT T GC C GT GG C AGGA 360 

I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

301 C C C C C GC AGAAG CT AC AGAT T CT C GT T GACACT GGAAGCAGTAACT T T GC C GT GG C AGGA 360 

361 AC C C C GC ACT C CT ACAT AGAC AC GT ACTTTGACAC AGAGAGGT C T AGC AC AT AC C GCT C C 42 0 

I I I I I II I I I II I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I 

361 AC C C C GC AC T C CT ACAT AGAC AC GT ACTTT GACACAGAGAGGT CT AGC AC AT AC C GCT C C 420 

421 AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 4 80 

I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

421 AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 4 80 

481 GAC CT C GT C AC CAT C C C CAAAGGCT T CAAT ACTT CT TTTCTTGT CAACAT T G C CACT ATT 540 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

481 GAC CTCGTCACCATCCCCAAAGGCTTCAATACTTCTTTTCTTGT CAACAT TGCCACTATT 540 

541 TTTGAATCAGAGAATTTCTTTTTGCCTGGGATTAAATGGAATGGAATACTTGGCCTAGCT 600 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

541 TTTGAATCAGAGAATTTCTTTTTGCCTGGGATTAAATGGAATGGAATACTTGGCCTAGCT 60 0 

601 TATGCCACACTTGCCAAGCCATCAAGTTCTCTGGAGACCTTCTTCGACTCCCTGGTGACA 660 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I 
601 TAT G C C ACAC T T GC CAAG C CAT CAAGT T C T CT GGAGACCT T CTT C GACT C C CT GGT GACA 660 

661 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 72 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

661 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 72 0 

721 GGATCTGGGACCAACGGAGGTAGTCTTGTCTTGGGTGGAATTGAACCAAGTTTGTATAAA 78 0 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 

721 GGAT CT GGGAC CAAC GGAGGT AGT CT T GT CT T GGGT GGAAT T GAAC CAAGT T T GT AT AAA 780 

781 GGAGACAT CT GGT AT AC C CCT AT TAAGGAAGAGT GGTACT AC CAGAT AGAAATT CT GAAA 84 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
781 GGAGACAT CT GGT AT AC C C CT AT TAAGGAAGAGT GGTACT AC CAGAT AGAAAT T CT GAAA 84 0 

841 TT GGAAAT T GGAGGC CAAAGC CT TAAT CT GGACT GCAGAGAGT ATAAC GC AGACAAGG C C 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
841 TT GGAAAT T G GAGGC CAAAGC CT TAAT CT GGACTGCAGAGAGT AT AAC GC AGACAAGG CC 900 

901 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

901 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 

961 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 102 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

961 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1020 

1021 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
1021 CAGCT GGCGT GCT GGAC GAAT T C G GAAAC AC CTT GGT CTT ACT T C C CTAAAAT CT C CAT C 1080 

1081 T ACCT GAGAG AT G AGAACT CCAGCAGGT CAT T C C GT ATCACAAT C CT GC CT CAGCT T T AC 114 0 
I | | | | | I I I I I I I I I I II I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II 



Db 



1081 TAC C T GAGAGAT GAGAACT C CAGCAGGT CAT T C C GT AT C ACAAT C CT GC CT CAGCTT T AC 114 0 



Qy 1141 AT T CAGC C CAT GAT GGGGGCCGGCCT GAAT TAT GAAT GT T ACC GATT C GG C AT TT CCC CA 12 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I M I I I I I I I I I I I I I I I I I I I I I 

Db 1141 ATTCAGCCCATGATGGGGGCCGGCCTGAATTATGAATGTTACCGATTCGGCATTTCCCCA 12 00 

Qy 1201 TCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGAC 12 60 

I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I II I I I I II I II I I I I II I I I I I I I I I 

Db 1201 TCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGAC 12 60 

Qy 1261 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 132 0 

M I I I I I I I I I II I I M I I I I I I II I I I I I I I I I I I I I I I M I I I II I I I I I I I I I I I I I 

Db 1261 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 132 0 

Qy 1321 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 138 0 

I | | | I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1321 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 138 0 

Qy 1381 CAGTCTTTGAGCGAGCCCATTTTGTGGATTGTGTCCTATGCGCTCATGAGCGTCTGTGGA 144 0 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1381 CAGT CTT T GAGC GAGC C CAT T T T GT GG AT T GT GT C CT AT GC GCT CAT GAGC GT CT GTGGA 144 0 

Qy 1441 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I M I I I I I I I I I I I 

Db 1441 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 

Qy 1501 C GT GAC C CT GAGGT C GT CAAT GAT GAGT CCTCTCTGGT C AGAC AT CGCT G GAAAT GAAT A 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I II I I I I I I 

Db 1501 CGT GAC C CT GAGGT C GT CAAT GAT GAGT C CT CT CT GGT C AGAC AT CGCT GGAAAT GAAT A 1560 

Qy 1561 GC CAGGC CT GACCT CAAG CAAC CAT GAACT C AGCT AT TAAGAAAAT CAC ATTT C CAGGGC 162 0 

I M I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1561 GC C AG GC CT GACCT CAAGCAAC CAT GAACT C AGCT AT TAAGAAAAT CAC AT T T C CAGGG C 162 0 

Qy 1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I 

Db 1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 168 0 

Qy 1681 GCTCCCAGATGCCTTCTAGATTCACTGTCTTTTGATTCTTGATTTTCAAGCTTTCAAATC 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1681 GCT C C C AGAT GCCT T CT AGAT T CACT GT CT TT T GAT T CT T GATTT T CAAG CT T T CAAAT C 174 0 

Qy 1741 CT C C CT ACT T C CAAGAAAAATAAT T AAAAAAAAAACT T CAT T CTAAAC CAAAAAAAAAAA 1800 

I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1741 CT C C C T ACTT C CAAGAAAAATAAT TAAAAAAAAAACT T C ATT CTAAAC CAAAAAAAAAAA 1800 

Qy 1801 AAAA 1804 

I I I I 

Db 1801 AAAA 1804 



RESULT 6 
AAS11516 

ID AAS11516 standard; cDNA; 1804 BP. 
XX 

AC AAS11516; 



DT 24-OCT-2001 (first entry) 
XX 

DE Human cDNA encoding Aspartyl protease 1 (Aspl) . 
XX 

KW Human; Aspartyl protease; Aspl; Asp2; beta-secretase; nootropic; 

KW neuroprotective; amyloid protein precursor; APP; Alzheimer's disease; 

KW amyloid-beta; Abeta; ss. 

XX 

OS Homo sapiens. 
XX 

FH Key Location/Qualifiers 

FT CDS 1. .1557 

FT /*tag= a 

FT /product^ "Aspl" 

XX 

PN WO200149098-A2 . 
XX 

PD 12-JUL-2001. 
XX 

PF 09-MAY-2001; 2001WO-IB000798 . 
XX 

PR 09-MAY-2001; 2001WO-IB000798 . 
XX 

PA (BIEN/) BIENKOWSKI M J. 

PA (GURN/) GURNEY M E . 

PA (HEIN/) HEINRIKSON R L. 

PA (PARO/) PARODI L A. 

PA (YANR/) YAN R. 

XX 

PI Bienkowski MJ, Gurney ME, Heinrikson RL, Parodi LA, Yan R; 
XX 

DR WPI; 2001-502549/55. 

DR P-PSDB; AAU06602. 
XX 

PT Novel purified polypeptide comprising fragment of mammalian aspartyl 

PT protease 2, lacking Asp2 transmembrane domain and retaining beta 

PT secretase activity of Asp2 useful for identifying inhibitors of Asp2 

PT activity. 

XX 

PS Example 2; Fig 1; 185pp; English. 
XX 

CC The invention relates to a purified polypeptide comprising a fragment of 

CC mammalian aspartyl protease (Asp) 2 protein which lacks the Asp2 

CC transmembrane domain and the Asp2 protein, and where the polypeptide and 

CC the fragment retain the beta-secretase activity of the mammalian Asp2 

CC protein. The invention also details polynucleotides for the Asp proteins 

CC and vectors expressing them, and a polypeptide (isoform of amyloid 

CC protein precursor (APP) ) comprising the amino acid sequence of an APP or 

CC its fragment containing an APP cleavage site recognizable by a mammalian 

CC beta-secretase, and further comprising two lysine residues at the 

CC carboxyl terminus of the amino acid sequence of the mammalian APP or APP 

CC fragment. Also included in the invention are methods of identifying 

CC modulators or inhibitors of Asp2 . Modulators and inhibitors of Asp2 are 

CC useful for treating Alzheimer's disease. APP is useful in methods for 

CC identifying inhibitors or modulators of human Asp2 activity and amyloid- 

CC beta (Abeta) peptide production. APP is also useful in designing 

CC therapeutics for the treatment or prevention of Alzheimer's disease. APP 



CC comprising the APP-Sw-beta-secretase peptide sequence (NLDA) , which is 

CC associated with increased levels of Abeta processing is useful in assays 

CC relating the Alzheimer f s research. The expression vector is useful for 

CC recombinantly expressing APP. Nucleic acids that hybridise to Asp 

CC oligonucleotides are useful as probes or primers. The probes are useful 

CC for detecting Hu-Asp nucleic acids in in vitro assays and in Northern and 

CC Southern blots. The present sequence encodes human Aspl 
XX 

SQ Sequence 1804 BP; 397 A; 520 C; 458 G; 429 T; 0 U; 0 Other; 

Query Match 100.0%; Score 1804; DB 4; Length 1804; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 1804; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

Qy 61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 12 0 

I M 1 I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I 

Db 61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 120 

Qy 121 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 180 

I I I I M I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 121 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 180 

Qy 181 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 24 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 181 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 24 0 

Qy 241 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 241 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 300 

Qy 301 CCCCCGCAGAAGCTACAGATTCTCGTTGACACTGGAAGCAGTAACTTTGCCGTGGCAGGA 360 

I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 301 C C C C C GCAGAAGCT AC AGAT T CT C GT T GACACT G GAAGC AGTAACT T T GC C GT GGCAG GA 360 

Qy 361 AC C C C GC ACT C CT ACAT AGACAC GT ACTTT GAC AC AGAGAG GT CTAGCACAT AC CGCT C C 420 

I I I I I I I I I I M I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 361 AC C C C GCACT C CT ACAT AGACAC GT ACT TT GAC AC AGAGAGGT CTAGCACAT AC C GCT C C 420 

Qy 421 AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 480 

I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 AAGGG CT T T GAC GT CAC AGT GAAGT AC AC ACAAGGAAGCT GGACG GGCT T C GT T GG GGAA 480 

Qy 4 81 GAC CT C GT CAC CAT C C C CAAAGGCT T CAAT ACT T CTTTTCTTGT CAACAT T GC C ACT AT T 540 

I | | I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

Db 4 81 GACCTCGTCACCATCCCCAAAGGCTTCAATACTTCTTTTCTTGTCAACATTGCCACTATT 540 

Qy 541 TTTGAATCAGAGAATTTCTTTTTGCCTGGGATTAAATGGAATGGAATACTTGGCCTAGCT 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 TTTGAATCAGAGAATTTCTTTTTGCCTGGGATTAAATGGAATGGAATACTTGGCCTAGCT 600 



Qy 

Db 



601 
601 



660 
660 



661 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 72 0 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I 

661 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 720 

721 G GAT CT G G GAC CAAC G GAG GT AGT CTTGTCTTGGGT GGAATT GAAC CAAGTTT GT ATAAA 78 0 

I I M I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I II I I I II I II I I I I I I 

721 GGATCT G GGAC CAAC G GAGGT AGT CT T GT CT T GGGT GGAATT GAAC CAAGTTT GT AT AAA 780 

781 GGAGACATCTGGT ATACCCCTATTAAGGAAGAGT GGTACTACCAGATAGAAATT CT GAAA 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

781 GGAGACATCT GGT AT ACCCCTATTAAGGAAGAGT GGTACTACCAGATAGAAATT CT GAAA 84 0 

841 T T GGAAAT T GGAGGC C AAAGC CT TAAT CT GGACT GC AGAGAGT ATAAC GCAGACAAGGC C 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

841 T T GGAAAT T GGAGGC CAAAGC CT TAAT CT G GACT GCAGAGAGT ATAAC GCAGACAAGGCC 900 

901 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
901 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 

961 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

961 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1020 

1021 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1021 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 1080 

1081 T ACCT GAGAGAT GAGAAC T C C AGC AGGT CAT T C C GT AT CACAAT C CT GC CT C AGCT TT AC 114 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1081 TAC CT GAGAGAT GAGAACT C C AG C AGGT CAT T C C GTAT CACAAT C CT GC CT CAGCTTT AC 1140 

1141 ATTCAGCCCATGATGGGGGCCGGCCTGAATTATGAATGTTACCGATTCGGCATTTCCCCA 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1141 ATTCAGCCCATGATGGGGGCCGGCCTGAATTATGAATGTTACCGATTCGGCATTTCCCCA 1200 

12 01 TCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGAC 12 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
12 01 T C C ACAAAT GC G CT GGT GAT C GGT GC CAC GGT GAT GGAGGGCT T CT AC GT CAT CT T C GAC 1260 

12 61 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1261 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 1320 

1321 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1380 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1321 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1380 

1381 CAGTCTTTGAGCGAGCCCATTTTGTGGATTGTGTCCTATGCGCTCATGAGCGTCTGTGGA 1440 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1381 CAGTCTTTGAGCGAGCCCATTTTGTGGATTGTGTCCTATGCGCTCATGAGCGTCTGTGGA 1440 

1441 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1441 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 



Qy 1501 C GT GAC C CT GAGGT C GT CAAT GAT GAGTC CT CT CT GGT CAGAC AT C G CT GGAAAT GAAT A 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 
Db 1501 C GT GAC C CT GAGGT C GT CAAT GAT GAGT CCTCTCTGGT CAGAC AT C GCT GGAAAT GAAT A 1560 

Qy 1561 G C CAGGC CT GAC CT CAAGCAAC CAT GAAC T CAGCT AT TAAGAAAAT CACATTT C CAGG GC 162 0 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

Db 1561 GC CAGGC CT GAC CT CAAGCAAC C AT GAACT CAGCT AT TAAGAAAATC AC AT TTCCAGGGC 1620 

Qy 1621 AGCAGC C GGGAT C GAT GGT GGCGCTTTCTCCTGTGCCCACCCGTCTT CAAT CTCTGTTCT 168 0 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 1680 

Qy 1681 GCT C C CAGAT GC CT T C T AGAT T CACT GT CT T T T GAT T CT T GATT T T CAAGCTT T CAAAT C 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 

Db 1681 GCTCCCAGATGCCTTCTAGATTCACTGTCTTTTGATTCTTGATTTTCAAGCTTTCAAATC 174 0 

Qy 17 41 C T C C C T AC T T C C AAG AAAAAT AAT T AAAAAAAAAACT T CAT T C T AAAC C AAAAAAAAAAA 18 00 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 1741 CT C C CTACT T C CAAGAAAAAT AAT T AAAAAAAAAACT T CAT T CTAAAC CAAAAAAAAAAA 1800 

Qy 1801 AAAA 1804 

I I I I 

Db 1801 AAAA 1804 



ABL52456; 

16-JUL-2002 (first entry) 

Human Asp-1 nucleotide sequence SEQ ID NO:l. 

Human; Asp-1; Asp-2; aspartyl protease; enzyme; Alzheimer's disease; 
proteolytic; chromosome 21; gene; ss. 



RESULT 7 
ABL52456 

ID ABL52456 standard; cDNA; 1804 BP. 
XX 
AC 
XX 
DT 
XX 
DE 
XX 
KW 
KW 
XX 
OS 
XX 
FH 
FT 
FT 
FT 
FT 
XX 
PN 
XX 
PD 
XX 
PF 
XX 
PR 
PR 
PR 
PR 
PR 



Homo sapiens. 

Key 
CDS 



Location/ Qualifiers 
1. .1557 
/*tag= a 
/product= "Asp-l" 
/note= "aspartyl protease" 



GB2367060-A. 
27-MAR-2002 . 

29-OCT-2001; 2001GB-00025934 . 



23-SEP-1999 
23-SEP-1999 
23-SEP-1999 
13-OCT-1999 
06-DEC-1999 



99US-00404133. 
99US-0155493P. 
99WO-US020881. 
99US-00416901. 
99US-0169232P. 



PR 22-SEP-2000; 2 000GB-00023315 . 
XX 

PA (PHAA ) PHARMACIA & UPJOHN CO. 
XX 

PI Bienkowkski MJ, Gurney M; 
XX 

DR WPI; 2002-397167/43. 

DR P-PSDB; ABB78589. 
XX 

PT Human aspartyl protease 1 substrates useful in assays to detect aspartyl 

PT protease activity, e.g. for the diagnosis of Alzheimer's disease. 

XX 

PS Claim 8; Fig 1; 182pp; English. 
XX 

CC The present invention describes a human aspartyl protease 1 (hu-Aspl) 

CC substrate (I) which comprises a peptide of no more than 50 amino acids, 

CC and which comprises the 8 amino acid sequence Gly-Leu-Ala-Leu-Ala-Leu- 

CC Glu-Pro. Also described are: (1) a method (II) for assaying hu-Aspl 

CC proteolytic activity, comprising: (a) contacting a hu-Aspl protein with 

CC (I) under acidic conditions; and (b) determining the level of hu-Aspl 

CC proteolytic activity; (2) a purified polynucleotide (III) comprising a 

CC nucleotide sequence that hybridises under stringent conditions to the non 

CC -coding strand complementary to a defined 18 04 nucleotide sequence (see 

CC ABL52456) where the nucleotide sequence encodes a polypeptide having Aspl 

CC proteolytic activity and lacks nucleotides encoding a transmembrane 

CC domain); (3) a purified polynucleotide (III') comprising a sequence that 

CC hybridises under stringent conditions to (III) (the nucleotide sequence 

CC encodes a polypeptide further lacking a pro-peptide domain corresponding 

CC to amino acids 23-62 of hu-Aspl (see ABB78589) ) ; (4) a vector (IV) 

CC comprising (III) or (III'); and (5) a host cell (V) transformed or 

CC transfected with (III), (III 1 ) and/or (IV). The hu-Aspl protease 

CC substrate (I) may be used as an enzyme substrate in assays to detect 

CC aspartyl protease activity, (II) and therefore diagnose diseases 

CC associated with aberrant hu-Aspl expression and activity such as 

CC Alzheimer's disease. Hu-Aspl has been localised to chromosome 21, while 

CC hu-Asp2 has been localised to chromosome llq23 . 3-24 . 1 . The present 

CC sequence encodes hu-Aspl from the present invention 

XX 

SQ Sequence 1804 BP; 397 A; 520 C; 458 G; 429 T; 0 U; 0 Other; 

Query Match 100.0%; Score 1804; DB 6; Length 1804; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 1804; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 1 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

Qy 61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1 61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 120 

Qy 121 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 180 

I I I I I I I I I I I I I I I I I I I II I M I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 121 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 180 



Qy 



181 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 240 



181 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 240 

241 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 300 

I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I M 

241 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 300 

301 C C CC C GCAGAAGCT ACAGAT T CT C GTT GACACT GGAAG C AGT AACT T T G C C GT GGC AGGA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I M I I I 
301 C C C C C GCAGAAGCT AC AGAT T CT C GTT GACACT GGAAG C AGT AACT T T GC C GT GGC AGGA 360 

361 AC C C C GCACT C CT ACAT AGACAC GTACTTT GAC ACAGAGAGGT CT AG C AC AT AC C GCT C C 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I M I I I I I 
361 AC C C C GCACT C CT AC AT AGACAC GT ACTTTGAC ACAGAGAG GT CT AG C AC AT AC C GCT C C 420 

421 AAGGGCT T T GAC GT C AC AGT GAAGT ACACACAAGGAAG CT G GAC G GGCT T C GT T GG GGAA 480 

I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

421 AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 4 80 

481 GACCTCGTCACCATCCCCAAAGGCTTCAATACTTCTTTTCTTGTCAACATTGCCACTATT 540 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

481 GACCTCGTCACCATCCCCAAAGGCTTCAATACTTCTTTTCTTGTCAACATTGCCACTATT 540 

541 TTTGTVATCAGAGAATTTCTTTTTGCCTGGGATTAAATGGAATGGAATACTTGGCCTAGCT 600 

I I I I I I I M I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
541 TTTGAATCAGAGAATTTCTTTTTGCCTGGGATTAAATGGAATGGAATACTTGGCCTAGCT 600 

601 T AT GC C ACACT T GC CAAGC C AT CAAGT T CT CT GGAGAC CT T CT T C GACT C C CT GGT GACA 660 

I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
601 TAT GC CACAC T T GC CAAGC CAT CAAGT T CT CTGGAGAC CT T CT T C GACT C C CT G GT GACA 660 

661 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I 

661 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 720 

721 GGATCTGGGACCAACGGAGGTAGTCTTGTCTTGGGTGGAATTGAACCAAGTTTGTATAAA 7 80 

I | | | | | | | I I I I M I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I 

721 GGAT CT GG GAC CAAC GGAGGT AGT CT T GT CTT GGGT GGAAT T GAAC CAAGT T T GT ATAAA 7 80 

781 G GAGACAT CT G GT AT AC C C CT ATTAAGGAAGAGT GGT ACT AC C AG AT AGAAATT CT GAAA 840 

I I I I I I I M I I I M II I I I II I I I I I I I I I I I I I I I I I I I I I I M I I I I I M I I I I I I I I 
781 GGAGACAT CT GGT AT AC C C CT AT T AAGGAAGAGT GGT ACT AC CAGAT AGAAAT T CT GAAA 840 

841 T T G GAAAT T G GAGGC CAAAGCCT TAAT CT GGACT GCAGAGAGT ATAAC GC AGACAAGGCC 900 

I I I I I I I I M I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
841 T T GGAAAT T GGAG GCCAAAGC CT T AAT CT GGACT GCAGAGAGT AT AAC GCAGACAAGG C C 900 

901 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 

I I I I I I I II M I I I I M I II II I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I 

901 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 

961 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1020 

| | | | | I I I I II I I I I M I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I M II M I I I 

961 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1020 

1021 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 1080 
I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 1021 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 1080 

Qy 1081 T AC CT GAGAGAT GAGAACT C CAG CAG GT CAT T C C GT AT CACAAT C CT G C CT C AGCT TT AC 114 0 

I I I I I I II I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 T AC CT GAGAGAT GAGAACT C C AGCAGGT CAT T C C GTAT CACAAT C CT GC CT CAGCTT T AC 1140 

Qy 1141 AT T CAGC C CAT GAT GGGGGC C GGC CT GAATTAT GAAT GT T AC C GAT T C GGC ATTT C CC CA 12 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 1141 ATT CAGC C CAT GAT GGGGG C C GGC CT GAATTAT GAAT GT TAC C GAT T C GGC ATT T C C C C A 1200 

Qy 12 01 TCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGAC 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 12 01 TCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGAC 1260 

Qy 1261 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 12 61 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 1320 

Qy 1321 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1380 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 1321 GT GT CT GAAAT TTCCGGGCCTTTCT CAAC AGAGGAT GT AGCC AGCAACT GT GT C C C C GCT 1380 

Qy 1381 C AGT CT T T GAG C GAGC CCAT T T T GT GGATT GT GT C CT AT GCGCT CAT GAGC GT CT GT GGA 144 0 

I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1381 CAGTCTTTGAGCGAGCCCATTTTGTGGATTGTGTCCTATGCGCTCATGAGCGTCTGTGGA 1440 

Qy 1441 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1441 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 

Qy 1501 C GT GAC C CT GAGGT C GT CAAT GAT GAGT CCT CT CT GGT CAGACAT C GCT GGAAAT GAAT A 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 1501 C GT GAC CCT GAG GT C GTCAAT GAT GAGT CCT CT CT GGT CAGACAT C GCT G GAAAT GAAT A 1560 

Qy 1561 GC CAGGC CT GAC CT CAAGCAAC CAT GAACT CAGCT AT TAAGAAAAT CAC ATTT C CAGGGC 1620 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II 

Db 1561 GC CAGGC CT GACCT CAAGCAAC CAT GAACT CAGCT AT TAAGAAAAT CAC ATTT C CAGGGC 1620 

Qy 1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 1680 

Qy 1681 GCTCCCAGATGCCTTCTAGATTCACTGTCTTTTGATTCTTGATTTTCAAGCTTTCAAATC 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 1681 GCTCCCAGATGCCTTCTAGATTCACTGTCTTTTGATTCTTGATTTTCAAGCTTTCAAATC 1740 

Qy 1741 CT C CCT ACT T C CAAGAAAAATAAT TAAAAAAAAAACT T CAT T CT AAAC CAAAAAAAAAAA 1800 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 1741 CT C CCT AC T T C CAAGAAAAATAAT TAAAAAAAAAACT T CAT T CT AAAC CAAAAAAAAAAA 1800 

Qy 1801 AAAA 1804 

I I I I 

Db 1801 AAAA 1804 



RESULT 8 
AAZ34056 



ID AAZ34056 standard; cDNA; 1879 BP. 
XX 

AC AAZ34056; 
XX 

DT 07-DEC-1999 (first entry) 
XX 

DE Human PR0852 nucleotide sequence. 
XX 

KW Human; PRO; EST; expressed sequence tag; PCR primer; hybridisation; 
KW probe; blood coagulation disorder; cancer; cellular adhesion disorder; 
KW secreted protein; transmembrane protein; ss. 
XX 

OS Homo sapiens. 
XX 

PN W09946281-A2 . 
XX 
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PR 


28 


-MAY- 


1998; 


98US- 


0087208P. 


PR 


30 


-JUL- 


1998; 


98US- 


0094651P. 


PR 


11 


-SEP- 


■1998; 


98US- 


■0100038P. 



XX 

PA (GETH ) GENENTECH INC. 
XX 

PI Wood WI, Goddard A, Gurney A, Yuan J, Baker KP, Chen J; 
XX 

DR WPI; 1999-551358/46. 



DR P-PSDB; AAY41714. 
XX 

PT New secreted and transmembrane polypeptides and their polynucleotides, 

PT useful for treating blood coagulation disorders, cancers and cellular 

PT adhesion disorders. 
XX 

PS Claim 2; Fig 72; 530pp; English. 
XX 

CC The present invention describes secreted and transmembrane polypeptides 

CC and their polynucleotides. The nucleotide sequences are useful as sources 

CC of probes, primers, for chromosome mapping, and for generation of 

CC antisense sequences. They can also be used to create transgenic animals. 

CC The proteins can be used to treat a variety of diseases and disorders, 

CC depending on their function. Diseases that may be treated include blood 

CC coagulation disorders, cancers and cellular adhesion disorders. They may 

CC also be used to raise antibodies. AAZ33891 to AAZ34338, and AAY41685 to 

CC AAY41774 represent polynucleotide and polypeptide sequence given in the 

CC exemplification of the present invention 
XX 

SQ Sequence 1879 BP; 388 A; 559 C; 498 G; 434 T; 0 U; 0 Other; 

Query Match 98.9%; Score 1784.4; DB 2; Length 1879; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 17 85; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 

Qy 1 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 94 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 153 

Qy 61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 120. 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 154 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 213 

Qy 121 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 

Db 214 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 273 

Qy 181 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 240 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I 

Db 274 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 333 

Qy 241 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 334 GTAGACAACCT GCAGGGGGACT CT GGCCGCGGCTACT ACCT GGAGAT GCTGAT CGGGAC C 393 

Qy 301 CCCCCGCAGAAGCTACAGATTCTCGTTGACACTGGAAGCAGTAACTTTGCCGTGGCAGGA 360 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I 

Db 394 CCCCCGCAGAAGCTACAGATTCTCGTTGACACTGGAAGCAGTAACTTTGCCGTGGCAGGA 453 

Qy 361 ACCCCGCACT CCTACATAGACACGTACTTT GACACAGAGAGGT CTAGCACATACCGCT CC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 454 ACCCCGCACT CCTACATAGACACGTACTTT GACACAGAGAGGT CTAGCACATACCGCT CC 513 

Qy 421 AAGGGCT T T GAC GTCAC AGT GAAGT AC ACACAAGGAAG CT GGAC GGGCTTCGT T GGGGAA 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 514 AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 573 



Qy 481 GACCT C GT CAC CAT C C C CAAAGGCTT CAAT ACT T CTTTTCTTGT CAAC ATT GC CACT AT T 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 574 GACCTCGTCACCATCCCCAAAGGCTTCAATACTTCTTTTCTTGTCAACATTGCCACTATT 633 

Qy 541 T TT GAAT C AGAGAATT T CT T T T T G C CT G GGAT TAAAT GGAAT G GAAT ACTT G G C CT AGCT 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I II I I I I I I I I I I I I 

Db 634 TTTGAATCAGAGAATTTCTTTTTGCCTGGGAT TAAAT GGAAT GGAAT ACTTGGCCTAGCT 693 

Qy 601 T AT GC CAC ACT T GCCAAGC CAT CAAGT T CT CT GGAGAC CT T CT T C GACTCC CT G GT GAC A 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I 

Db 694 T AT GC C ACACTT GCCAAGC CAT CAAGTT C T CT GGAGAC CT T CT T C GACT CC CT G GT GAC A 7 53 

Qy 661 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 754 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 813 

Qy 721 GGAT CT G GGAC CAAC GGAG GT AGT CTT GT CT T GGGT G GAAT T GAAC CAAGT T T GT ATAAA 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 814 GGATCTGGGACCAACGGAGGTAGTCTTGTCTTGGGTGGAATTGAACCAAGTTTGTATAAA 873 

Qy 781 G GAGACAT CT GGT AT ACC C CT AT TAAGGAAGAGT GGT ACT AC CAGAT AGAAAT T CT GAAA 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 874 G GAGACAT CT GGT AT AC C CCT AT TAAGGAAGAGT GGT ACT AC CAGAT AGAAAT T CT GAAA 933 

Qy 841 TTGGAAATT GGAGGCCAAAGCCTTAAT CT GGACT GCAGAGAGTATAACGCAGACAAGGCC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 934 TTGGAAATT GGAGGCCAAAGCCTTAAT CT GGACT GCAGAGAGTATAAC GCAGACAAGGCC 993 

Qy 901 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

Db 994 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 1053 

Qy 961 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1020 

I I I I I I I II I I I I I I i I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1054 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1113 

Qy 1021 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCT7\AAATCTCCATC 108 0 

I I I I I I M I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I M 

Db 1114 CAGCTGGCGTGCT GGAC GAATTCGGAAACACCTT GGT CTTACTTCCCTAAAATCTCCATC 1173 

Qy 1081 TACCT GAGAGAT GAGAACTCCAGCAGGT CATT CCGTATCACAAT CCTGCCT CAGCTTTAC 114 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1174 TACCT GAGAGAC GAGAAC T C C AGC AGGT CAT T C C GT AT CACAAT CCTGCCT CAGCT T T AC 1233 

Qy 1141 ATT CAGC C CAT GATGGGG GC C GGC CT GAAT TAT GAAT GTT AC C GAT T C GGC AT TT C C C C A 1200 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1234 ATT CAGC C CAT GATGGGGGC C GGC CT GAAT TAT GAAT GTT AC C GAT T C GGC AT T T C C C C A 1293 

Qy 1201 TCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGAC 1260 

I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 1294 TCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGAC 1353 

Qy 1261 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGC AGAAAT TGCAGGTGCTGCA 1320 

I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1354 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 1413 

Qy 1321 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 138 0 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 II 1 1 1 1 1 1 1 1 

Db 1414 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 147 3 

Qy 1381 CAGTCTTTGAGCGAGCCCATTTTGTGGATTGTGTCCTATGCGCTCATGAGCGTCTGTGGA 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1474 CAGTCTTTGAGCGAGCCCATTTTGTGGATTGTGTCCTATGCGCTCATGAGCGTCTGTGGA 1533 

Qy 1441 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1534 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1593 

Qy 1501 C GT GAC C CT GAGGT C GT CAAT GATGAGTCCT CT CT GGT C AGACAT C GCT GGAAAT GAAT A 1560 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1594 C GT GAC C CT GAGGT C GT CAAT GAT GAGTCCT CTCT GGT C AGACAT C GCT GGAAAT GAAT A 1653 

Qy 1561 GC CAGGC CT GAC CT CAAGCAAC CAT GAACT CAGCT ATTAAGAAAAT C ACATT T C C AGGGC 162 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1654 GC C AGG C CT GAC CT CAAGCAAC CAT GAACT CAGCT ATTAAGAAAAT C ACATTT C C AGGGC 1713 

Qy 1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 168 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1714 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 177 3 

Qy 1681 GCTCCCAGATGCCTTCTAGATTCACTGTCTTTTGATTCTTGATTTTCAAGCTTTCAAATC 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I 

Db 1774 GCTCCCAGATGCCTTCTAGATTCACTGTCTTTTGATTCTTGATTTTCAAGCTTTCAAATC 1833 

Qy 1741 CT C C CT ACT T C CAAGAAAAAT AAT TAAAAAAAAAACTTCATT CT AA 1786 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1834 C T C C CT AC T T C CAAGAAAAAT AAT T AAAAAAAAAACT T CAT T CT AA 1879 
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XX 

PA (GETH ) GENENTECH INC. 
XX 

PI Ashkenazi AJ, Baker KP, Botstein D, Desnoyers L, Eaton DL; 

PI Ferrara N, Filvaroff E, Fong S, Gao W, Gerber H, Gerritsen ME; 

PI Goddard A, Godowski PJ, Grimaldi CJ, Gurney AL, Hillan KJ; 

PI Kljavin IJ, Kuo SS, Napier MA, Pan J, Paoni NF, Roy MA, Shelton DL; 

PI Stewart TA, Tumas D, Williams PM, Wood WI ; 

XX 

DR WPI; 2000-611443/58. 

DR P-PSDB; AAB44270. 
XX 

PT Novel PRO polypeptides and polynucleotides used in detection methods, to 

PT target bioactive molecules to specific cells, and to modulate cellular 

PT activities. 
XX 

PS Claim 2; Fig 72; 636pp; English. 
XX 

CC AAC78458 to AAC78599 represent polynucleotide and EST (expressed sequence 

CC tag) sequences which encode secreted or transmembrane PRO polypeptides. 

CC The PRO polynucleotides and polypeptides have cytostatic activity. The 

CC polynucleotides and polypeptides can be used for detecting the presence 

CC of PRO polypeptides in samples, for linking bioactive molecules to cells 

CC and for modulating biological activities of cells, using the polypeptides 

CC for specific targeting. The polypeptide targeting can be used to kill the 

CC target cells, e.g. for the treatment of cancers. The polypeptide pairs 

CC provide specific targeting of bioactive molecules to cells. AAC78600 to 

CC AAC78987 represent PCR primers and probes used in the isolation of the 

CC PRO polynucleotide sequences 
XX 

SQ Sequence 1879 BP; 388 A; 559 C; 498 G; 434 T; 0 U; 0 Other; 

Query Match 98.9%; Score 1784.4; DB 3; Length 1879; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 1785; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 

Qy 1 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 

Db 94 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 153 

Qy 61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 12 0 

1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 154 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 213 



Qy 


121 


CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 

| | | | | | | I I 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 

CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 


180 


Db 


214 


273 


Qy 


181 


GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 

I I I I I I I 1 M 1 1 1 1 1 1 1 1 1 1 1 M M 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 II 1 1 1 

GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 


240 


Db 


274 


333 


Qy 


241 


GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 

| | || | | | | | | 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 


300 


Db 


334 


393 


Qy 


301 


CCCCCGCAGAAGCTACAGATTCTCGTTGACACTGGAAGCAGTAACTTTGCCGTGGCAGGA 

M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

CCCCCGCAGAAGCTACAGATTCTCGTTGACACTGGAAGCAGTAACTTTGCCGTGGCAGGA 


360 


Db 


394 


453 


Qy 


361 


ACCCCGCACT CCTACAT AGACACGTACTTT GACACAGAGAGGT CT AGCACATAC CGCTCC 

| I I I I M 1 1 1 1 1 1 1 1 II M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 M 1 1 1 II 1 

AC C C CGC ACT C CT AC AT AGACAC GT ACT T T GACACAGAGAGGT CT AGCACATAC CGCTCC 


420 


Db 


454 


513 


Qy 


421 


AAGGGCT T T GAC GT C AC AGT GAAGTACAC ACAAGGAAGCT G GAC GGGCTT CGTT GGGGAA 

| | | | | | | | | | 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 


480 


Db 


514 


573 


Qy 


481 


GAC CT CGTCAC CAT C C C CAAAGGCTT CAAT ACT T CT T T T CT T GT CAAC ATTGC CACT AT T 

| I I I I I I I I M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

GAC CT C GT C AC CAT C C CCAAAGGCTT CAAT ACT T CT T T T CT T GT CAACATTGCC ACT ATT 


540 


Db 


574 


633 


Qy 


541 


T T T GAAT CAGAGAAT TTCTTTTT GC CTGGGATTAAAT GGAAT GGAAT ACTT GGC CT AG CT 

| | I 1 1 1 1 1 1 1 1 1 1 M 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 

T TT GAAT CAGAGAAT TTCTTTTT GC CT GGGAT T AAAT GGAAT G GAAT ACTTGGCCT AGCT 


600 


Db 


634 


693 


Qy 


601 


T AT GC CACACT T GC CAAG C CAT CAAGT T CTCT GGAGACCT T CT T C GACT C CCT GGT GACA 
| | | | | | | | | | | | | 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 M 1 II 1 1 1 II 1 1 1 1 1 1 
TAT G C CAC ACTT GCCAAGC CAT CAAGT T CT CT GGAGAC CTT CT T C GACT C C CT GGT GACA 


660 


Db 


694 


753 


Qy 


661 


CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 

| || | | | | I I I 1 1 I II 1 1 II II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 

CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 


720 


Db 


754 


813 


Qy 


721 


GGAT CT GGGAC CAAC GGAGGT AGT CT T GT CTTGGGT GGAAT T GAAC CAAGT TTGTAT AAA 

M | | | | || 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 M 1 1 M 1 1 1 1 1 1 1 

GGAT CT GGGAC CAAC GGAG GT AGT CT T GT CTT GGGT G GAAT T GAAC CAAGT T T GT AT AAA 


780 


Db 


814 


873 


Qy 


781 


GGAGACAT CT GGT AT AC C CCT AT T AAGGAAGAGT GGT ACT AC CAGAT AGAAAT T CT GAAA 
M 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 M II 1 1 1 1 M 1 1 1 1 1 II 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 
GGAGACAT CT G GT AT AC C C CT AT T AAGGAAGAGT GGT ACT AC CAGAT AGAAAT T CTGAAA 


840 


Db 


874 


933 


Qy 


841 


T T GGAAAT T GGAGGCCAAAGC CT T AAT CT GGACT GCAGAGAGT ATAAC GCAGACAAGGCC 

| | | || | | | | | | | | 1 1 1 1 1 1 1 II II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M II II 1 1 1 1 1 1 1 1 

T T GGAAATT GGAGGCCAAAGCCTTAAT CT GGACTGCAGAGAGT ATAACGCAGACAAGGCC 


900 


Db 


934 


993 


Qy 


901 


ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 

| | | | M | | | | 1 II 1 1 I | 1 1 1 1 1 1 1 II 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 II II 1 1 

ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 


960 


Db 


994 


1053 



Qy 

Db 


961 
1054 


GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 

|| | | | | I I I I I 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 


1020 
1 1 1 6 


Qy 


1021 


CAGCT GG C GT GCT GGAC GAAT T C GGAAAC AC CT T G GT CT T ACT T CCCT AAAAT CT C CAT C 

1 | | | | | | | | I 1 II 1 1 1 1 1 1 II 1 1 1 II 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 i 1 1 1 1 1 II 

CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 


n a o n 

1080 


Db 


1114 


1173 


Qy 


1081 


TAC CT GAGAGAT GAGAACT CC AGCAGGT CAT T C C GT AT CACAAT CCT GC CT CAGC T T T AC 
I I I I I I I I 1 1 1 | | I I I I 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 M 1 1 
TACCT GAGAGACGAGAACTCCAGCAGGT CATT CCGTATCACAATCCT GCCT CAGCTTTAC 


1140 


Db 


1174 


1233 


Qy 


1141 


ATT CAGC C CAT GAT G G GGGC CGGCCT GAATT AT GAAT GT T ACCGAT T C GGCAT T T C C C C A 

I I I I I I I I I I 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

ATT CAGC C CAT GAT GGGGG C CGGCCT GAAT TAT GAAT GT T AC CGAT T CGG C AT TT C CC C A 


1200 


Db 


1234 


1293 


Qy 


1201 


TCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGAC 

| | | | I I I I I I I I M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 II 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 

TCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGAC 


1260 


Db 


1294 


1353 


Qy 


1261 


AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 

I I I I I I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 II 1 1 1 M 

AGAGC C C AGAAGAG GGT GGGCTT C GCAGC GAGC C C CT GT GC AGAAAT T GCAGGT GCT GCA 


1320 


Db 


1354 


1413 


Qy 


1321 


GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 

M 1 1 1 1 1 1 1 1 M 1 1 M 1 1 1 1 1 1 1 1 1 1 1 M 1 II 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 

GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 


1380 


Db 


1414 


1473 


Qy 


1381 


CAGTCTTTGAGCGAGCCCATTTTGTGGATTGTGTCCTATGCGCTCATGAGCGTCTGTGGA 

|| | | | | II 1 1 1 I | | 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 II 1 1 

C AGT CT T T GAG CGAGC CCATT T T GT GGAT T GT GT C CT AT GC GCT CAT GAGC GT CT GT GGA 


1440 


Db 


1474 


1533 


Qy 


1441 


GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 

I I I I I I I I M 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 M 

GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 


1500 


Db 


1534 


1593 


Qy 


1501 


C GT GAC CCT GAGGT C GT CAAT GAT GAGT C CT CT CT GGT CAGAC AT C GCT GGAAAT GAAT A 
| | | | I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 
CGT GACCCT GAGGT CGTCAAT GAT GAGTCCT CT CT GGTCAGACAT CGCT GGAAAT GAATA 


1560 


Db 


1594 


1653 


Qy 


1561 


GC C AGGC CT GAC CT CAAGCAAC CAT GAACT CAGCT ATTAAGAAAAT C AC ATTT C CAGGG C 

I || M II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M II II II 1 1 1 1 1 1 1 

G C C AGGC CT GAC CT CAAG CAAC CAT GAACT CAGCT ATTAAGAAAAT C AC AT T T C CAGGGC 


1620 


Db 


1654 


1713 


Qy 


1621 


AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCTVATCTCTGTTCT 

1 M I 1 1 1 1 1 1 1 M II M 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 


1680 


Db 


1714 


1773 


Qy 


1681 


GCT CC C AGAT GCCTT CT AGATT CACT GT CT T T TGATT CT T GAT TT T CAAGCTTT CAAAT C 

| | I M 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 M II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

GCTCCCAGATGCCTTCTAGATTCACTGTCTTTTGATTCTTGATTTTCAAGCTTTCAAATC 


1740 


Db 


1774 


1833 


Qy 


1741 


CT C C CT ACT T CCAAGAAAAAT AAT T AAAAAAAAAACT T CAT T CT AA 1786 

1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 

CT C C CT ACT T C CAAGAAAAATAAT T AAAAAAAAAACT T CAT T CT AA 1879 




Db 


1834 





RESULT 10 
AAS45960 

ID AAS45960 standard; cDNA; 1879 BP. 
XX 

AC AAS45960; 
XX 

DT 18-DEC-2001 (first entry) 
XX 

DE Human DNA encoding PRO polypeptide sequence #36. 
XX 

KW PRO polypeptide; mammal; tumour; cancer; human; cattle; horse; sheep; ss; 

KW dog; cat; pig; goat; rabbit; tumour necrosis factor alpha; TNF-alpha; 

KW blood; chondrocyte cell; cell proliferation; cell differentiation; colon; 

KW adrenal; lung; breast; prostate; rectum; cervix; liver; genetic disorder; 

KW PCR primer. 

XX 

OS Homo sapiens. 
XX 

PN WO200168848-A2 . 
XX 
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; 2000US- 
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PR 
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: 2000US- 
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; 2000US- 


0193032P. 


PR 
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r 2000US- 


0193053P. 


PR 
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; 2000WO- 


US008439. 


PR 
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r 2000US- 


0194449P. 


PR 
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; 2000US- 


0194647P. 


PR 
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0195975P. 


PR 
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PR 
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PR 
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PR 
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0196820P. 


PR 


18- 
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; 2000US- 


0198121P. 


PR 
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: 2000US- 
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PR 
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25 


-APR- 


•2000; 


r 2000US- 
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PR 
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-MAY- 
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• 2000US- 


0201516P. 


PR 
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-MAY- 
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; 2000WO- 


US013705. 


PR 


22- 


-MAY- 
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; 2000WO- 


US014042. 


PR 


30- 


-MAY- 
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r 2000WO- 
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-JUN- 
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r 2000WO- 
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-JUN- 
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PR 28-JUL-2000; 2000WO-US0207 10 . 

PR 22-AUG-2000; 2000US-00644848 . 

PR 24-AUG-2000; 2000WO-US023328 . 

PR 08-NOV-2000; 2 000WO-US030952 . 

PR 01-DEC-2000; 2000WO-US032678 . 

PR 20-DEC-2000; 2000WO-US034956 . 
XX 

PA (GETH ) GENENTECH INC. 
XX 

PI Baker KP, Chen J, Desnoyers L, Goddard A, Godowski PJ, Gurney AL; 

PI Pan J, Smith V, Watanabe CK, Wood WI, Zhang Z; 

XX 

DR WPI; 2001-602746/68. 

DR P-PSDB; AAU29059. 
XX 

PT Novel nucleic acids encoding PRO polypeptides, used to diagnose the 

PT presence of tumors, such as prostate and breast tumors, in mammals and to 

PT screen for modulators of the compounds. 

XX 

PS Claim 2; Fig 71; 774pp; English. 
XX 

CC Sequences AAS45925-AAS4 6231 represent DNA molecules encoding and PCR 

CC primers for PRO polypeptides of the invention. The sequences of the 

CC invention can be used to detect the presence of a tumour in a mammal by 

CC comparing the level of expression of a PRO polypeptide in a test sample 

CC of cells from the animal and a control sample of normal cells, whereby a 

CC ' higher level of expression in the test sample indicates the presence of a 

CC tumour in the mammal. Mammals include dogs, cats, cattle, horses, sheep, 

CC pigs, goats and rabbits but are preferably human. The polypeptides can be 

CC used to stimulate tumour necrosis factor (TNF) alpha release from human 

CC blood, when contacted with it. A specific polypeptide can be used to 

CC stimulate the proliferation or differentiation of chondrocyte cells. The 

CC PRO proteins can be used to determine the presence of tumours and also 

CC susceptibility to tumour development, particularly adrenal, lung, colon, 

CC breast, prostate, rectal, cervical, or liver tumours, in mammalian 

CC subjects. The oligonucleotide probes specific for the PRO nucleic acids 

CC can be used for genetic analysis of individuals with genetic disorders 

XX 

SQ Sequence 1879 BP; 388 A; 559 C; 498 G; 434 T; 0 U; 0 Other; 



Query Match 98.9%; Score 1784.4; DB 4; Length 1879; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 1785; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 

Qy 1 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 1 I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I 

Db 94 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 153 



Qy 61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 120 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 154 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 213 

Qy 121 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 214 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 273 



Qy 



181 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 240 



27 4 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 333 

241 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

334 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 393 

301 C CC C C G CAGAAGCT ACAGAT T CT C GTT GAC ACT GGAAG C AGT AACT T T G C CGT GGCAGGA 360 

I I I I I I I I I II I I I I M I I I I I I II I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I 

394 C CCC C G C AGAAG CTACAGAT T CT C GTT GAC ACT GGAAGC AGT AACT T T G C CGT GGCAGGA 4 53 

361 ACC C C G C ACT C CT AC AT AGACAC GT ACT T T GAC AC AGAGAGGT CT AG C ACAT AC C GCT CC 420 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

454 ACC C C GC ACT C CT ACAT AGACAC GT ACT T T GAC AC AGAGAGGT CTAGCACAT AC C GCT CC 513 

421 AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 4 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

514 AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 573 

481 GAC CT C GT CAC CAT CCC CAAAGGCTTCAAT ACT T CT T T T CT T GT CAAC AT T GC C ACT ATT 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

574 GAC CT C GT CAC CAT CCC CAAAGG CTT CAAT ACT T CT T T T CT T GT CAACAT T GC C ACT ATT 633 

541 TT T GAAT C AGAGAAT T T CT T T T T GC CT GGGAT T AAAT GGAAT GGAAT ACT T GGC CT AGCT 600 

I I I I I I I I I I I I I M I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I 
634 TT T GAAT CAGAGAAT TTCTTTTTGCCT GGGAT T AAAT GGAAT GGAAT ACT T GGC CT AGCT 693 

601 TAT GC C AC ACT T GC CAAGC CAT CAAGT T CT CT G GAGAC CT T CTT CGACT C CCT GGT GACA 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
694 TAT GC CAC ACT T GC CAAGC CAT CAAGT T CT CT G GAGAC CT T CTT C GACT C CCT GGT GACA 7 53 

661 CAAGCAAACAT CCC CAACGT T T T CT CCAT GCAGAT GT GT GGAGC CGGCTTGCCCGTTGCT 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
754 CAAGCAAACAT CCC CAACGT T T T CT CCAT GCAGAT GT GT GGAGC C GGCT T GC C C GT T GCT 813 

721 GGAT CT GGGAC CAAC GGAG GT AGT CTTGTCTTG GGT GGAAT T GAACCAAGTT T GT AT AAA 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

814 GGAT CT GGGAC CAAC G GAG GT AGT CTTGTCTTG GGT GGAAT T GAAC CAAGTT T GT AT AAA 873 

781 GGAGACAT CTGGTATACCC CTATTAAGGAAGAGTGGT ACT ACCAGATAGAAATT CT GAAA 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
874 GGAGACAT CTGGT AT ACCCCTATTAAGGAAGAGTGGTACT ACCAGATAGAAATT CT GAAA 933 

841 TT GGAAAT T GGAG GC CAAAG C CTT AAT CT GGAC TGC AGAGAGT ATAAC GCAGACAAGGCC 9 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
934 TT GGAAAT T GGAG GC CAAAG C CTT AAT CT G GACTGC AGAGAGT ATAAC GCAGACAAGGCC 993 

901 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

994 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 1053 

961 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1054 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1113 

1021 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 108 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 



1114 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 1173 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



1081 TAG CTGAGAGAT GAGAACT C C AGC AG GT CAT T C C GT AT CACAAT C CT GC CT CAGCT T T AC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I M I I I II I 

1174 T AC CT GAGAGAC GAGAACT C CAGCAG GT CAT T C C GTAT CACAAT C CT GC CT CAGCT TT AC 1233 

1141 ATT CAGC C CAT GAT G GGGG C CGGC CT GAAT TAT GAAT GTT AC C GAT T C GGC AT T T C C CC A 1200 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I II I I I M I I I I 
1234 AT T CAG C CCAT GAT G GG GGC C GGC CT GAAT TAT GAAT GTT AC C GAT T C GGCAT T T C C C C A 1293 

12 01 TCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGAC 12 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1294 TCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGAC 1353 

1261 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 1320 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1354 AGAGCC C AGAAGAGGGT GGGCTTCG CAGC GAGC C C CT GTGC AGAAAT T GCAGGT GCT G C A 1413 

1321 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1380 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1414 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1473 

1381 C AGT CT T T GAGC GAGCC CAT T T T GT GGAT T GT GT C CT AT GC GCT CAT GAG CGT CT GT G GA 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I 
1474 CAGT CT T T GAGC GAGCC CAT T T T GT GGAT T GT GT C CT AT GC GCT CAT GAG CGT CT GT GGA 1533 

1441 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I M I I I II I I I I I I I I I I I I I I I I I I I I I 
1534 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1593 

1501 C GT GAC C CT GAGGT C GT CAAT GAT GAGT CCTCTCTGGT CAGACAT C GCT GGAAAT GAAT A 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
1594 C GT GAC C CT GAGGT C GT CAAT GAT GAGT C CT CT C T GGT CAGACAT C GCT G GAAAT GAAT A 1653 

1561 GC C AGGC CT GAC CT CAAGCAAC CAT GAACT CAG CT AT T AAGAAAAT CACATTT CC AGGGC 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I 

1654 GC CAGG C CT GAC CT CAAGCAAC CAT GAACT CAGCT AT T AAGAAAAT C ACATTT C C AGG G C 1713 

1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

1714 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 1773 

1681 GCTCCCAGATGCCTTCTAGATTCACTGTCTTTTGATTCTTGATTTTCAAGCTTTCAAATC 1740 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I II I I I I I I I I I I I I I I 
1774 GCTCCCAGATGCCTTCTAGATTCACTGTCTTTTGATTCTTGATTTTCAAGCTTTCAAATC 1833 

1741 CTCCCTACTTCCAAGAAAAATAATTAAAAAAAAAACTTCATTCTAA 1786 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I 

1834 CTCCCTACTTCCAAGAAAAATAATTAAAAAAAAAACTTCATTCTAA 1879 



RESULT 11 
ABX78563 

ID ABX7 8563 standard; cDNA; 1879 BP. 
XX 

AC ABX78563; 
XX 



DT 15-APR-2003 (first entry) 
XX 

DE Human PRO polynucleotide #3 6. 
XX 

KW Human; PRO; gene; ss; cytostatic; tumour; cancer; breast; lung; stomach; 

KW liver; dog; cat; cow; horse; sheep; pig; goat; rabbit; ADEPT; 

KW antibody-dependent enzyme mediated prodrug therapy. 
XX 

OS Homo sapiens . 
XX 

PN US2003027272-A1 . 
XX 
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I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
454 AC C C C G C ACT C CT ACAT AGACAC GT ACT TT GAC ACAGAGAGGT C T AGCACAT AC C GCT C C 513 
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AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 480 
I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I M II I I I I II II I I I I I I I I I I M I I 
AAGG GCT T T GAC GT C AC AGT GAAGT ACACACAAGGAAGCT G GACGGGCT T C GTT G GGGAA 573 

GAC CT C GT C AC CAT C C C CAAAG GCT T CAATACTTCT T T T CT T GT CAAC AT T GCCACT AT T 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I M 

GAC CT C GT C AC CATCC C CAAAGGCT T CAAT ACTT CT T T T CT T GT CAAC AT T GCC ACTAT T 633 

T T T GAAT CAGAGAAT TTCTTTTT GC CT GGGAT T AAAT GGAAT GGAAT ACT T GGCC T AGCT 600 

I I M I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I 
TTTGAATCAGAGAATTTCTTTTTGCCTGGGATTAAAT GGAAT GGAAT ACTTGGCCTAGCT 693 

TATGCCACACTTGCCAAGCCATCAAGTTCTCTGGAGACCTTCTTCGACTCCCTGGTGACA 660 
I I I I I I I I I M I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 813 

GGATCTGGGACCAACGGAGGTAGTCTTGTCTTGGGTGGAATTGAACCAAGTTTGTATAAA 7 80 

| I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

G GAT CTGGGAC CAACGGAGGT AGT CT T GT CT T G G GT GGAAT T GAAC CAAGT T T GT AT AAA 873 

GGAGACAT CT GGTATAC CCCT ATTAAGGAAGAGT GGTACTACCAGATAGAAATT CTGAAA 840 

I | | | | | I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I M I I I I I I I I 

G GAGACAT CT GGTATAC C C CT ATT AAGGAAGAGT GGT ACT AC C AGAT AGAAAT T CT GAAA 933 
T T GGAAAT T G GAGGC CAAAG C CT TAAT CT GGACT GCAGAGAGT AT AAC GCAGACAAG GCC 900 

I | | | II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I M I I I I I I I I I II I I I I I I I 

TTGGAAATTGGAGGCCAAAGCCTTAATCTGGACTGCAGAGAGTATAACGCAGACAAGGCC 993 

ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 

I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 1053 

GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1020 

I I M I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1113 



I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I II I M I 

CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 1173 

T ACCTGAGAGAT GAGAACT CCAGCAGGT CATT CC GTAT CACAAT CCTGCCT CAGCTTT AC 114 0 
M I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



| | | | | | || | | | | | | | I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I 
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Query Match 98.9%; Score 1784.4; DB 7; Length 1879; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 1785; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 

Qy 1 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 94 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 153 

Qy 61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 154 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 213 

Qy 121 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 214 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 273 

Qy 181 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 24 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I 

Db 274 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 333 

Qy 241 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 334 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 393 

Qy 301 CCCCCGCAGAAGCTACAGATTCTCGTTGACACTGGAAGCAGTAACTTTGCCGTGGCAGGA 360 

I | | | | | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I M I 

Db 394 CCCCCGCAGAAGCTACAGATT CT CGTT GACACT GGAAGCAGTAACTTT GCCGT GGCAGGA 453 

Qy 361 AC C CC GC ACT C CT AC AT AGAC AC GT ACT T T GAC AC AGAGAGGT CT AG C AC AT AC CG CT C C 42 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I 
Db 454 ACC CCGCACT C CTAC AT AGACAC GT ACT T T GAC ACAG AGAGGT CT AGCACAT AC C GCT C C 513 

Qy 421 AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I M I I I I I I I I I I I 

Db 514 AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 573 

Qy 481 GACCT CGT C AC CAT CC C CAAAGG CT T CAAT ACT T CTTTTCTTGT CAACAT T GC CACT AT T 54 0 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 574 GACCT CGT CAC CAT C C C CAAAGGCT T CAAT ACT T CT T TT CT T GT CAACAT T GC CACT AT T 633 

Qy 541 TTT GAAT C AGAGAAT TTCTTTTTGCCT GGGATT AAAT G GAAT G GAAT ACT T GGC CT AGCT 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I M II I I I I I I I I I I M I I I 

Db 634 TTTGAATCAGAGAATTTCTTTTTGCCTGGGATTAAATGGAATGGAATACTTGGCCTAGCT 693 



QY 



601 TATGCCACACTTGCCAAGCCATCAAGTTCTCTGGAGACCTTCTTCGACTCCCTGGTGACA 660 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 

Db 694 TAT G C C ACACTT GC CAAGC C AT CAAGTT CT CT GGAGAC CT T CTT C GACT C C CT GGTGAC A 753 

Qy 661 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 754 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 813 

Qy 721 GGATCTGGGACCAACGGAGGTAGTCTTGTCTTGGGTGGAATTGAACCAAGTTTGTATAAA 780 

I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II II I I II I I I 

Db 814 GGATCTGGGACCAACGGAGGTAGTCTTGTCTTGGGTGGAATTGAACCAAGTTTGTATAAA 873 

Qy 781 GGAGACAT CT GGTAT AC C C CT AT T AAGGAAGAGT G GT ACT ACC AGAT AGAAAT T CT GAAA 84 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I III I I I I 

Db 874 GGAGACAT CT GGTAT AC C C CT AT TAAGGAAGAGT GGT ACT ACC AGAT AGAAAT T CT GAAA 933 

Qy 841 TT G GAAAT T GGAGGC CAAAGC CT TAATCT GGACT GC AGAGAGT AT AAC GCAGAC AAGGC C 900 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 934 TT GGAAATTGGAGGCCAAAGCCTTAATCT GGACT GCAGAGAGTATAACGCAGACAAGGCC 993 

Qy 901 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 994 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 1053 

Qy 961 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 102 0 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 1054 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1113 

Qy 1021 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1114 C AG CT G G C GT GCT GGAC GAAT T C GGAAAC AC CT T GGT CT T ACTT C C C TAAAAT CT CCAT C 1173 

Qy 1081 T AC CT GAGAGAT GAGAACT C CAGCAGGT CAT T C C GT AT C ACAAT C CT GC CT CAGCTTT AC 114 0 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I 

Db 1174 T AC CT GAGAGAC GAGAACT C CAGCAGGT CAT T C C GT AT C ACAAT C CT G C CT CAGCTTT AC 1233 

Qy 1141 AT T C AG C C CAT GAT GGGGGC C GGC CT GAAT TAT GAAT GT T ACCGAT T C GGCAT T T CCC CA 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1234 AT T C AGC C CAT GAT GGGGGCCGGCCT GAAT TAT GAAT GT T ACCGAT T C GGCAT T T C CC C A 1293 

Qy 1201 T C C ACAAAT GCGCT GGT GAT C GGT G CCAC GGT GAT GGAG GGCTT CT AC GT CAT CTT CGAC 1260 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1294 T C C ACAAAT GCGCT GGT GAT C GGT G CCAC GGT GAT GGAG GGCTT C T AC GT CAT CTT CGAC 1353 

Qy 1261 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1354 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGC AGAAAT TGCAGGTGCTGC A 1413 

Qy 1321 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1380 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I 
Db 1414 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1473 

Qy 1381 C AGT CT T T GAGCGAG C C CAT T T T GT GGAT T GT GT C CT AT G C G CT CAT GAGC GT CT GTGG A 144 0 

I I I I I I I I I I II I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I 
Db 1474 C AGT CT T T GAGCGAGC C CAT T T T GT GGATT GT GT C CT AT GCGCT CAT GAG CGT CT GTGGA 1533 

Qy 1441 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 

I I I I I I II I I I I I I I I I I I M I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 1534 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1593 

Qy 1501 C GT GAC CCTGAGGT C GT CAAT GAT GAGT C CT CT CT GGT C AGACAT C GCT GGAAAT GAATA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I M I I I I I I I I 
Db 1594 C GT GAC CCTGAG GT C GT CAAT GAT GAGT C CT CT CT GGT CAGACAT C GCT GGAAAT GAATA 1653 

Qy 1561 GC CAGGCCT GAC CT CAAGCAAC CAT GAACT CAGCTAT TAAGAAAAT CACATTT C CAGGGC 162 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1654 GC CAGGCCT GAC CT CAAGCAAC CAT GAACT CAGCTATTAAGAAAAT CACATTT C CAGGGC 1713 

Qy 1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 168 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1714 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 1773 

Qy 1681 GCTCCCAGATGCCTTCTAGATTCACTGTCTTTTGATTCTTGATTTTCAAGCTTTCAAATC 174 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I M I I I I I 

Db 1774 GCT C C CAGAT GC CT T CT AGAT T CACT GT CTTT T GAT T CT T GAT TT T CAAGCTT T CAAAT C 1833 

Qy 1741 CT C C CT ACT T C CAAGAAAAATAAT TAAAAAAAAAACT T CAT T CTAA 1786 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 1834 CT C C CTACT T C CAAGAAAAATAAT TAAAAAAAAAACTT CAT T CTAA 1879 

RESULT 13 
ACA71015 



ID ACA71015 standard; cDNA; 1879 BP. 
XX 

AC ACA71015; 
XX 

DT 02-AUG-2003 (first entry) 
XX 

DE Human secreted/transmembrane protein (PRO) cDNA #36. 
XX 

KW Human; gene; ss; secreted and transmembrane protein; PRO; TNF-alpha; 

KW tumour necrosis factor alpha; chondrocyte cell; tumour; gene therapy; 

KW tissue typing. 
XX 

OS Homo sapiens . 
XX 

PN US2 003032 112-A1. 
XX 

PD 13-FEB-2003. 
XX 

PF 21-JUN-2002; 2002US-00176756 . 
XX 

PR 18-SEP-1997; 97US-0059263P . 

PR 18-SEP-1997; 97US-00592 66P . 

PR 17-OCT-1997; 97US-0062250P . 

PR 21-OCT-1997; 97US-00634 86P . 

PR 24-OCT-1997; 97US-0063120P . 

PR 24-OCT-1997; 97US-006312 IP . 

PR 28-OCT-1997; 97US-0063540P . 

PR 28-OCT-1997; 97US-0063541P . 

PR 28-OCT-1997; 97US-0063544P . 

PR 28-OCT-1997; 97US-0063564P . 

PR 29-OCT-1997; 97US-0063734P . 

PR 31-OCT-1997; 97US-0063870P . 
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Query Match 98.9%; Score 1784.4; 

Best Local Similarity 99.9%; Pred. No. 0; 



DB 7; Length 1879; 



Matches 1785; Conservative 



0; Mismatches 



1; Indels 



0; Gaps 



Qy 1 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

Db 94 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 153 

Qy 61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 120 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I II I I I II I I I I I I I I I I 

Db 154 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 213 

Qy 121 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 18 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 214 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 273 

Qy 181 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 24 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 274 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 333 

Qy 241 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 334 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 393 

Qy 301 CCCCCGCAGAAGCTACAGATTCTCGTTGACACTGGAAGCAGTAACTTTGCCGTGGCAGGA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 394 CCCCCGCAGAAGCTACAGATTCTCGTTGACACTGGAAGCAGTAACTTTGCCGTGGCAGGA 453 

Qy 361 AC C CCGC ACT C CTAC AT AGACAC GT ACT T T GAC AC AGAGAGGT CTAGCAC AT AC C GCT C C 42 0 

M I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 454 AC C CCGC ACT C CTAC AT AGACAC GT ACT T T GAC AC AGAGAGGT CT AG CACAT AC C GCT CC 513 

Qy 421 AAG G GCT T T GAC GT C AC AGT GAAGT ACAC ACAAGGAAGCT GGAC GGGCTT C GT T G GGGAA 48 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 514 AAG GGCT T T GAC GT C AC AGT GAAGT ACAC ACAAGGAAG CT GGAC GGGCTT CGTT G GGGAA 573 

Qy 481 GACCTCGTCACCATCCCCAAAGGCTTCAATACTTCTTTTCTTGTCAACATTGCCACTATT 54 0 

I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I M I 

Db 574 GACCTCGTCACCATCCCCAAAGGCTTCAATACTTCTTTTCTTGTC7\ACATTGCCACTATT 633 

Qy 541 T T T GAAT C AGAGAAT TTCTTTTT GC CTGGGAT T AAAT GGAAT GGAAT ACTT GGC CT AGCT 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I 

Db 634 TTT GAAT C AGAGAATT T CTTTTTGCCT GGGAT T AAAT GGAAT GGAAT ACTT G GC C T AGCT 693 

Qy 601 TATGCCACACTTGCCAAGCCATCAAGTTCTCTGGAGACCTTCTTCGACTCCCTGGTGACA 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 694 TATGCCACACTTGCCAAGCCATCAAGTTCTCTGGAGACCTTCTTCGACTCCCTGGTGACA 753 

Qy 661 CAAG CAAAC AT C C C CAAC GT T T T CT CCAT GCAGAT GT GT GGAGC CGGCTTGCCCGTTGCT 72 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

Db 754 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 813 

Qy 721 G GAT CTGGGAC CAAC GGAGGT AGT CTT GTCT T GG GT G GAAT T GAACCAAGTT T GT AT AAA 78 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I IN 

Db 814 GGAT CT GGGAC CAAC GGAGGT AGT CTT GT CT T GGGT GGAAT T GAAC CAAGTT T GT ATAAA 873 

Qy 781 GGAGACATCTGGTATAC CCCT ATTAAGGAAGAGT GGT ACT ACCAGATAGAAATT CT GAAA 84 0 

I I I I I I I I I I I I I I I I M I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 874 G GAGACAT CT GGT AT AC C C CT AT T AAG GAAGAGT G GT ACT AC CAGAT AGAAAT T CT GAAA 933 



841 T T GGAAATT GGAG GC CAAAGC C T TAAT CT GGAC T G CAG AGAGT AT AAC GCAGACAAGG C C 900 

I I I I I I I I I I II I I I I II I I I II II I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I 

934 T T GGAAATT GGAG GC CAAAGC C T TAAT CT GGACT G CAGAGAGT AT AAC G CAGACAAGG C C 993 

901 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

994 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 1053 

961 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

1054 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1113 

1021 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 108 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

1114 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 1173 

1081 T AC CT GAGAGAT GAGAACTC C AG CAGGT CAT T C C GT AT CACAAT C CT GC CT CAGCT T TAC 114 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

1174 T AC CT GAGAGAC GAGAACT C CAG CAGGT CAT T C C GT AT CACAAT C CT GC CT CAGCT T TAC 1233 

1141 ATTCAGCCCATGATGGGGGCCGGCCTGAATTATGAATGTTACCGATTCGGCATTTCCCCA 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1234 ATT CAGC CCAT GAT G GGG GC C GG C CT GAATT AT GAAT GT T ACC GAT T C GGC ATT T C C CC A 1293 

1201 T C C ACAAAT GC G CT G GT GAT C G GT GC C AC GGT GAT GGAGGGCT T CT AC GT CAT CT T C GAC 1260 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

12 94 T C C ACAAAT GC G C T GGT GAT C G GT GC C AC GGT GAT GGAGGGCT T CT AC GT CAT CTT C GAC 1353 

1261 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 1320 

I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1354 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 1413 

1321 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 138 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1414 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 147 3 

1381 CAGTCTTTGAGCGAGCCCATTTTGTGGATTGTGTCCTATGCGCTCATGAGCGTCTGTGGA 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1474 CAGT CT T TGAG C GAGC C C ATT T T GT GGAT T GT GT C CT AT G CGCT CAT GAGC GTCT GT GGA 1533 

1441 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 

I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1534 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1593 

1501 C GT GAC C CT GAG GT C GT CAAT GAT GAGT C CT CT CT GGT C AGACAT CGCT GGAAAT GAAT A 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1594 C GT GAC C CT GAGGT C GT CAAT GAT GAGT C CT CT CT GGT C AGACAT CGCT GGAAAT GAAT A 1653 

1561 GC C AG GC CT GAC CT CAAGCAAC CATGAACT CAGCT AT T AAGAAAAT CAC AT TT C C AGGGC 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

1654 GC CAGGC CT GAC CT CAAG CAAC CAT GAACT CAGCT ATT AAGAAAAT CAC AT TTC CAGGGC 1713 

1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 168 0 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1714 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 1773 



Qy 



1681 GCT C C CAGAT GC CT T CT AGATT CACT GT CT TT T GAT T CT T GAT T T T CAAGCT T T CAAAT C 17 40 




Db 



1774 GCTCCCAGATGCCTTCTAGATTCACTGTCTTTTGATTCTTGATTTTCAAGCTTTCAAATC 1833 



Qy 



1741 C T C C CT ACT T C CAAGAAAAATAAT T AAAAAAAAAACTT C AT T CTAA 1786 




Db 



1834 CTCCCTACTTCCAAGAAAAATAATTAAAAAAAAAACTTCATTCTAA 1879 



RESULT 14 
ACC87543 

ID ACC87543 standard; cDNA; 1879 BP. 
XX 

AC ACC87543; 
XX 

DT 05-AUG-2003 (first entry) 
XX 

DE Human secreted polypeptide PR0852-encoding cDNA, SEQ ID NO: 71. 
XX 

KW Human; PRO; secreted protein; transmembrane protein; 

KW extracellular domain; tumour necrosis factor-alpha; TNF-alpha; 

KW chondrocyte; proliferation; differentiation; cartilage disorder; 

KW bone disorder; arthritis; sports injury; cancer; tumour; diagnosis; 

KW adrenal tumour; lung; colon; breast; prostate; kidney; rectum; cervix; 

KW liver; drug screening; transgenic animal; genetic analysis; 

KW antiarthritic; vulnerary; gene therapy; gene; ss. 

XX 

OS Homo sapiens. 
XX 

PN US2003027278-A1. 
XX 

PD 06-FEB-2003. 
XX 



PF 21-JUN-2002; 2002US-00176987 . 
XX 
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Query Match 98.9%; Score 1784.4; DB 7; Length 1879; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 17 85; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 

Qy 1 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 94 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 153 

Qy 61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 120 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 154 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 213 



Qy 

Db 



121 

214 



180 
273 



Qy 181 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 24 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M M 

Db 274 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 333 

Qy 241 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 334 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 393 

Qy 301 CCCCCGCAGAAGCTACAGATTCTCGTTGACACTGGAAGCAGTAACTTTGCCGTGGCAGGA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I M I I I I I I I I 

Db 394 CCCCCGCAGAAGCTACAGATTCTCGTTGACACTGGAAGCAGTAACTTTGCGGTGGCAGGA 453 

Qy 361 ACCC CGCACT CCTACAT AGACACGTACTTT GACACAGAGAGGT CTAGCACATACCGCT C C 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I 

Db 454 AC C C C GCACT C CTAC AT AGACAG GT ACT TT GAC AC AGAGAGGT CT AG CAC AT AC C GCT C C 513 

Qy 421 AAGG GCTT T GAC GT C ACAGT GAAGT ACACACAAGGAAGCT GGAC GG GCT T C GTT GG GGAA 4 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 514 AAGGGCTTTGACGTCACAGT GAAGT ACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 573 

Qy 481 GAC CT C GT CAC CAT C C C CAAAGGCT T CAATACT T CT TT T CTT GT CAACAT T GC CAC TAT T 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I 

Db 574 GAC CT C GT CAC CAT C C C CAAAGGCT T CAATACT T CT T T T CTT GT CAACAT T GC CAC TAT T 633 

Qy 541 TT T GAAT CAGAGAAT T T CT TTTTGCCT GGGAT T AAAT GGAAT GGAAT ACT T GGC CT AG CT 600 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I 

Db 634 TT T GAAT CAGAGAAT T T CT TT T T GC CT G GGAT T AAAT G GAAT GGAAT ACT T GGC CT AGCT 693 

Qy 601 TATGCCACACTTGCCAAGCCATCAAGTTCTCTGGAGACCTTCTTCGACTCCCTGGTGACA 660 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I 

Db 694 TATGCCACACTTGCCAAGCCATCAAGTTCTCTGGAGACCTTCTTCGACTCCCTGGTGACA 753 

Qy 661 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 720 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 754 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 813 

Qy 721 GGATCTGGGACCAACGGAGGTAGTCTTGTCTTGGGTGGAATTGAACCAAGTTTGTATAAA 7 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I M I I I 

Db 814 GGATCTGGGACCAACGGAGGTAGTCTTGTCTTGGGTGGAATTGAACCAAGTTTGTATAAA 8 73 

Qy 781 GGAGACAT CT GGTATAC CCCTATTAAGGAAGAGT GGTACTACCAGATAGAAATT CTGAAA 84 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I 

Db 874 GGAGACAT CT GGTAT ACCCCTATTAAGGAAGAGT GGTACTACCAGATAGAAATT CT GAAA 933 

Qy 841 TT GGAAAT T GGAGGC CAAAGC CTTAAT CTGGACT GC AGAGAGT AT AAC GC AGACAAGGC C 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 934 TT GGAAAT T GGAGGC CAAAGC CTTAAT CTGGAC T GC AGAGAGT AT AAC G C AGACAAGGC C 993 

Qy 901 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

Db 994 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 1053 

Qy 961 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1054 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1113 



Qy 1021 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 1080 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 1114 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 1173 

Qy 1081 T AC C T GAGAGAT GAGAACT C C AGCAGGT C ATT C C GT AT C ACAAT C CT G CCT C AGCTT T AC 114 0 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I 
Db 1174 T AC CT GAGAGAC GAGAACT C C AGCAGGT CAT T C C GT AT C ACAAT C CT GC CT C AGCT T T AC 1233 

Qy 1141 ATTCAGCCCATGATGGGGGCCGGCCTGAATTATGAATGTTACCGATTCGGCATTTCCCCA 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1234 ATTCAGCCCATGATGGGGGCCGGCCTGAATTATGAATGTTACCGATTCGGCATTTCCCCA 1293 

Qy 1201 T CCACAAAT GC GCT GGT GAT C G GT GC C AC GGT GAT GGAG GGCT T CT AC GT CAT CT T C GAC 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 1294 T CCACAAAT GC G CT G GT GAT C GGT GC C AC GGT GAT GGAGG GCT T CT AC GT CAT CT T CGAC 1353 

Qy 1261 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 1320 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1354 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 1413 

Qy 1321 GTGT CT GAAAT TTCCGGGCCTTTCT CAACAGAGGAT GT AGCCAGCAACT GT GT C C C C GCT 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1414 GT GT C T GAAAT TT C CGGGCCTTTCT CAACAGAGGAT GT AG CCAGCAAC T GT GT C C C C GCT 1473 

Qy 1381 CAGTCTTTGAGCGAGCCCATTTTGTGGATTGTGTCCTATGCGCTCATGAGCGTCTGTGGA 1440 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1474 CAGTCTTTGAGCGAGCCCATTTTGTGGATTGTGTCCTATGCGCTCATGAGCGTCTGTGGA 1533 

Qy 1441 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 1534 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1593 

Qy 1501 C GT GAC C CT GAGGT C GT CAAT GAT GAGT C CT CT CT GGT C AGAC AT C GC T GGAAAT GAAT A 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1594 C GT GAC C CT GAGGT C GT CAAT GAT GAGT C CT CT CT GGT C AGAC AT C GCT GGAAAT GAAT A 1653 

Qy 1561 GCCAGGCCT GAC CTCAAGCAACCAT GAACTCAGCTATTAAGAAAATCACATTT CCAGGGC 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

Db 1654 GCC AG GC CT GAC CT CAAG CAAC CAT GAACTCAGCT AT TAAGAAAAT C ACAT TT C CAGGGC 1713 

Qy 1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 1680 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1714 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 1773 

Qy 1681 GCTCCCAGATGCCTTCTAGATTCACTGTCTTTTGATTCTTGATTTTCAAGCTTTCAAATC 1740 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 177 4 GCTCCCAGATGCCTTCTAGATTCACTGTCTTTTGATTCTTGATTTTCAAGCTTTCAAATC 1833 

Qy 1741 CTC C CT ACT T C CAAGAAAAAT AATTAAAAAAAAAACT T C ATT CT AA 1786 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

Db 1834 CTCCCTACTTCCAAGAAAAATAATTAAAAAAAAAACTTCATTCTAA 1879 
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ACC86929 

ID ACC86929 standard; cDNA; 1879 BP. 
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05-AUG-2003 (first entry) 

Human secreted polypeptide PR0852-encoding cDNA, SEQ ID NO: 71. 

Human; PRO; secreted protein; transmembrane protein; 
extracellular domain; tumour necrosis factor-alpha; TNF-alpha; 
chondrocyte; proliferation; differentiation; cartilage disorder; 
bone disorder; arthritis; sports injury; cancer; tumour; diagnosis; 
adrenal tumour; lung; colon; breast; prostate; kidney; rectum; cervix; 
liver; drug screening; transgenic animal; genetic analysis; 
antiarthritic; vulnerary; gene therapy; gene; ss. 

Homo sapiens. 
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nnQTQRRP 
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y o u b 


uuy /y / ir . 


pp 
rK 


9 ^ 
z b 


AU G 


1 Q Q ft . 

x y y o , 


Q RTTQ — 

y o u b 


uuy / y / ^ir. 


pp 
rK 


9 £ 
Z D 




1 QQO . 

x y y o f 




nnQftm av> 


DP 
PK 


Ul 


o ill r 


1 QQP . 

±y y o f 


Q QTT c _ 

y o u b 


n HQ ft 7 1 £D 
UUyo / IDr . 


DD 

rK 


U X 


CUD 

— o JL r — 


1 QQp , 

x y y o ; 


Q ft TT Q — 

y o u b 


uuyo / Zor. 


pp 
rK 


n 9 
uz 


— Q TT P — 


x y y o / 


Q P.TTQ — 

y o u b 


uuyoouor. 


PP 


no 
u z 


_ C T7P — 


1 QQQ . 

x j y o / 


Q QTT C _ 


ODQft ft 9 1 P 


PR 
r k 


09 
u z 


_ c pp_ 


1 QQft • 
x j y o r 


Q QTTC_ 

y o u o 


ODQft ft A ^P 
uu joo4 or * 


PD 
r K 


n q 
u y 




1 QQ ft • 

x y y o r 


Q ftTT C — 

y o u o 


nnQQ(^n9P 

uuyyou^r . 


PR 


IU 


C TP Ti 

-obP- 


1 Q Q O • 

iy y o ; 


Q QTT C 

y oub- 


finQQT/l 1 p 

uuyy / 'dir. 


PR 


10 


-SEP- 


1998; 


98US- 


0099754P. 


PR 


10 


-SEP- 


1998; 


98US- 


•0099763P. 


PR 


10 


-SEP- 


1998; 


98US- 


0099812P. 


PR 


15 


-SEP- 


1998; 


98US- 


0100388P. 


PR 


16 


-SEP- 


1998; 


98US- 


•0100662P. 


PR 


16 


-SEP- 


1998; 


98US- 


■0100664P. 


PR 


16 


-SEP- 


1998; 


98US- 


■0101751P. 



r r\ 


1 6- 




1 QQP * 

J. Z? J O / 


"OviU 




PR 
r r\ 


1 7- 


O Hi JT 






uiuuQOOr • 


PR 


1 7- 

X / 


QT?D_ 

o Hi r 


-L _? _? 0 / 


Q QTTC;_ 
y O U O 


uiuuooi r . 


PD 
rK 


1 7- 
X / 




X 2? _7 0 , 


you o 


m nriQi qp 
u x u u y x y r . 


PR 
n K 


1 7 - 
X / 


ct?p— 




y o u o 


m n n q ^ n p 
uxuuyour . 


r K 


1 P — 
10 




1 QQO . 

X -7 _7 O / 


y o u o 


uxuuo^yjr. 


PR 


1 ft - 
X o 


ODE 


X -7 .7 O , 




n i m n i ax> 


PR 
r K 


1 ft _ 


C T?P — 


1 QQO . 

X -7 -7 0 f 


Q OTTC _ 

y o u o 


UlUlUDOr . 


rK 


Z o ■ 


C C 1 D 


1 QQO , 

x y y o ; 


QQTTC 
y 0 U O - 


n i n i /i ti d 
U x UX4 / xr. 


TDD 

rK 


Z J 




1 QQO . 

x y y o , 


QQTTC 

y oUo- 


UXUX4 / Z Jr . 


r K 


O 'J 
Z J 


bLMr 


1 QQO . 

x y y o / 


Q QTT C 

y o u o 


ni m ai^t> 

UXUX4 / Or. 


PR 

rK 


Z J" 


oHir 


1 QQO , 

x y y o ; 


QQTTC — 

y o u o 


m ni ati~d 
uxux4 / / r. 


rK 


Z 4 


CUT) 


1 QQO . 

x y y o , 


QQTTC — 

y o u o 


m ni TTfiD 


Ti T"> 

rK 


Z 4 _ 


bbr — 


1 QQO . 

i y y y ; 


QQTTC 

y 0 ub— 


m ni itqd 
UXUX /jyr. 


rK 


O /I 

Z 4 - 


btr — 


1 QQQ . 

xy y o ; 


y ouo- 


ni ni T/itd 
UXUX / 4 Or . 


D -p) 

rK 


Z 4~ 


btr — 


1 QQQ , 

±y y o ; 


QQTTC 

y O U O 


uxuxyzzr . 


Ti Ti 

FK 


ZD — 


ohr- 


1 QQQ , 

i y y o ; 


QQTTC 

y o uo— 


n i ni tqcd 
UXUX / o Or . 


rK 


z y — 


CT7D 


1 QQQ , 

xy y cs ; 


QQTTC 

y o uo — 


ni nooniD 
U X UZZ U / r . 


PR 


29- 


SEP- 


1998 ; 


98US- 


0102240P . 


PR 
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PR 
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0102331P. 


PR 
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98US- 
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PR 
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Query Match 98.9%; Score 1784.4; DB 7; Length 1879; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 1785; Conservative 0; Mismatches 1; Indels 0; Gaps 



0; 



QY 
Db 



94 



ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 153 



Qy 

Db 



61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

154 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 213 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



121 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I II I I I I I I I I I I 

214 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 273 



181 



241 



240 



GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

274 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 333 



300 



GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I II I I I I I I I I I 

334 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 393 

301 C C C C C G C AG AAG C T AC AG AT T C T C GT T G AC AC T G GAAG C AGT AAC TTTGCCGTGG C AG G A 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

3 94 CCCCCGCAGAAGCTACAGATTCTCGTTGACACTGGAAGCAGTAACTTTGCCGTGGCAGGA 453 



Qy 



361 



AC C C C GCACT C CT ACAT AGACAC GT ACT TT GACAC AGAGAGGT CT AGCACAT ACCGCT CC 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I 



420 



Db 454 AC C C C GCACT C CT ACAT AGAC AC GT ACTT T GAC ACAGAGAGGT CT AGC AC AT AC C G CT C C 513 

Qy 421 AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 4 80 

I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I 

Db 514 AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 573 

Qy 481 GACCTCGTCACCATCCCCAAAGGCTTCAATACTTCTTTTCTTGTCAACATTGCCACTATT 540 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 574 GAC CT CGT CAC CAT CCC CAAAGG CTT CAAT ACT T CT TT T CT T GT CAACAT T G C CACT AT T 633 

Qy 541 T T T GAAT CAGAGAATT T CT T T T T G CCT GGGAT T AAAT GGAAT GGAAT ACT T G GCC T AGCT 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 634 T T T GAAT CAGAGAATT T CT T T T T G CCT G GGAT TAAAT GGAAT GGAAT ACT T GG CCT AGCT 693 

Qy 601 TAT G C CAC ACT T GC CAAGC CAT CAAGT T CT CT G GAGAC CT T CTT CGACT C CCT GGT GACA 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 694 TAT G C CAC ACT T GC CAAGC CAT CAAGT T CT CT G GAGAC CT T CTT CGACT C C CT GGT GACA 753 

Qy 661 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 754 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 813 

Qy 721 G GAT CT G GGAC CAACGGAGGT AGT CT T GT CTT G GGT GGAAT T GAAC CAAGT T T GT AT AAA 7 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 814 GGATCTGGGAC CAACGGAGGT AGT CT T GT CTT G GGT GGAAT T GAAC CAAGT TTGT AT AAA 873 

Qy 781 G GAGACAT CT GGT AT AC C C CT AT T AAGGAAGAGT GGT ACT AC CAGAT AGAAAT T CT GAAA 84 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 874 G GAGACAT CT G GT AT AC C C CT AT T AAGGAAGAGT GGT AC T AC CAGAT AGAAAT T CT GAAA 933 

Qy 841 T T GGAAAT T GGAG GCCAAAGC CT T AAT CT GGAC T GCAGAGAGTATAAC GC AGACAAGGC C 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 934 T T GGAAAT T GGAGGCCAAAGC CT T AAT CT GGAC T GCAGAGAGTATAAC GC AGACAAGGC C 993 

Qy 901 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

Db 994 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 1053 

Qy 961 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1020 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 1054 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1113 

Qy 1021 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1114 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 1173 

Qy 1081 T AC CT GAGAGAT GAGAAC T C CAGCAGGT CAT T C C GT AT C ACAAT CCT GC CT C AGCT T TAG 1140 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1174 T AC CT GAGAGAC GAGAACT C CAGCAGGT CAT T C C GT AT C ACAAT CCT GC CT C AG CT T T AC 1233 

Qy 1141 AT T C AGC C CAT GAT GGGGGCCGGCCT GAAT TAT GAAT GT T AC C GAT T C GGC AT TT C C C CA 1200 

I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

Db 1234 ATT C AGC C CAT GAT GGGGGCCGGCCT GAAT TAT GAAT GT T AC C GAT T C GGC ATTT C C C CA 1293 

Qy 1201 TCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGAC 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I! I I I I I 

Db 1294 TCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGAC 1353 



Qy 1261 AGAGC C CAGAAGAGG GT G G G C T T C GCAGC GAG C C C CT GT GC AGAAAT T GCAGGT GCT GC A 132 0 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1354 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 1413 

Qy 1321 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 138 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1414 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1473 

Qy 1381 CAGT CT TT GAGCGAG C C CAT T T T GT G GAT T GT GT C CT AT GC GCT CAT GAGC GT CT GT GGA 144 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1474 CAGT CT T T GAGCGAG C CC AT T T T GT GGAT T GT GT C CT AT GC GCT CAT GAG C GT CT GT GGA 1533 

Qy 1441 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1534 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1593 

Qy 1501 C GT GAC C CT GAGGT C GT CAAT GAT GAGT CCTCTCTGGT C AGACAT C G CT GGAAAT GAAT A 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1594 C GT GAC C CT GAGGT C GT CAAT GAT GAGT C CT CT CT GGT C AGACAT C GCT GGAAAT GAAT A 1653 

Qy 1561 GC C AG G C CT GACCT CAAGCAAC CAT GAAC T CAGCT AT TAAGAAAAT C AC AT T T C CAGGG C 162 0 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I II I I I I I I I I I 

Db 1654 G C C AGG C CT GACCT CAAGCAAC CAT GAACT CAGCT AT TAAGAAAAT C AC AT T T C CAGGG C 1713 

Qy 1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 168 0 

I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1714 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 1773 

Qy 1681 GCTCCCAGATGCCTTCTAGATTCACTGTCTTTTGATTCTTGATTTTCAAGCTTTCAAATC 174 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1774 GCT C C CAGAT GC CT T C T AGAT T C ACT GT CT T T T GATT CT T GAT TT T CAAGCT T T CAAAT C 1833 

Qy 1741 CT CCCTACTTCCAAGAAAAATAATTAAAAAAAAAACT T CATTCTAA 178 6 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I 
Db 1834 CTCCCTACTTCCAAGAAAAATAATTAAAAAAAAAACTTCATTCTAA 1879 



Search completed: February 28, 2004, 05:52:16 
Job time : 723 sees 



GenCore version 5.1.6 
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OM nucleic - nucleic search, using sw model 



Run on : 
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(without alignments) 
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Title : 

Perfect score: 
Sequence : 



US-09-668-314C-1 
1804 

1 atgggcgcactggcccgggc 



aaaccaaaaaaaaaaaaaaa 1804 



Scoring table: IDENTITY_NUC 

Gapop 10.0 , Gapext 1.0 



Searched: 682709 seqs, 277475446 residues 

Total number of hits satisfying chosen parameters: 1365418 



Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 

Post-processing: Minimum Match 0% 

Maximum Match 100% 
Listing first 45 summaries 



Database : Issued_Patents_NA: * 

1 : /cgn2_6/ptodata/2/ina/5A_COMB. seq: * 

2 : /cgn2_6/ptodata/2/ina/5B_COMB. seq: * 

3 : /cgn2_6/ptodata/2/ina/6A_COMB. seq: * 

4 : /cgn2_6/ptodata/2/ina/6B_COMB. seq: * 

5 : /cgn2_6/ptodata/2/ina/PCTUS_COMB. seq: * 

6 : /cgn2_6/ptodata/2/ ina/backf ilesl . seq: * 

Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 
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RESULT 1 

US-09-548-372D-1 

; Sequence 1, Application US/09548372D 

; Patent No. 6420534 

; GENERAL INFORMATION: 

; APPLICANT: GURNEY ET AL. 

TITLE OF INVENTION: ALZHEIMER'S DISEASE S EC RET AS E, APP SUBSTRATES THEREFOR 
AND USES 

; TITLE OF INVENTION: THEREOF 
; FILE REFERENCE: 29915/62801 

; CURRENT APPLICATION NUMBER: US/09/548, 372D 
; CURRENT FILING DATE: 2000-04-12 

PRIOR APPLICATION NUMBER: US 60/155,493 
; PRIOR FILING DATE: 1999-09-23 
; PRIOR APPLICATION NUMBER: US 09/404,133 
; PRIOR FILING DATE: 1999-09-23 
; PRIOR APPLICATION NUMBER: PCT/US99/208 8 1 
; PRIOR FILING DATE: 1999-09-23 



PRIOR APPLICATION NUMBER: US 60/101,594 
PRIOR FILING DATE: 1998-09-24 
NUMBER OF SEQ ID NOS: 73 
SOFTWARE: Patentln version 3.1 
SEQ ID NO 1 
LENGTH: 1804 
TYPE : DNA 

ORGANISM: Homo sapiens 
US-09-548-372D-1 

Query Match 100.0%; Score 1804; DB 4; Length 1804; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 18 04; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

Qy 61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 12 0 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 12 0 

Qy 121 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 18 0 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 121 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 18 0 

Qy 181 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 24 0 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 181 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 240 

Qy 241 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 300 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 241 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 3 00 

Qy 301 C C C C C GCAGAAGCT AC AGATT CT C GT T GACACT GGAAG C AGT AACT T T GCCGT GGC AGGA 360 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

Db 301 CC C C C GCAGAAGCT AC AGAT T CT C GT T GACACT GGAAGC AGT AACTT T GCCGT G GC AGGA 360 

Qy 361 AC C C C GCACT C CT AC AT AGACAC GT ACT TT GAC ACAGAGAGGT CT AGC ACAT AC C GCT C C 42 0 

I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 361 AC C C C GCACT C CT ACAT AGACAC GTACT TT GACACAGAGAGGT CT AGC AC AT AC C G CT CC 42 0 

Qy 421 AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 421 AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 480 

Qy 4 81 GAC CT C GT C AC CAT C C CCAAAG GCTT CAAT ACT T CT T T T CT T GT CAAC ATT GC C ACT AT T 54 0 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4 81 GAC CT C GT CAC CAT C C C CAAAGGCTTCAATACT TCTTTTCTT GT CAAC AT T GC CACT AT T 54 0 

Qy 541 TTT GAAT CAGAGAAT T T CT T T T T GC CT GGGAT T AAAT GGAAT GGAAT ACT T GGC CT AGCT 600 

I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 541 T TT GAAT CAGAGAAT T T CT TT T T GC CT GGGAT T AAAT GGAAT GGAAT ACT TG GC CT AGCT 600 



Qy 

Db 



601 
601 



660 
660 



661 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 720 

I I I I I 1 I I I ! I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I M I I I 

661 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 72 0 

721 GGATCTGGGACCAACGGAGGTAGTCTTGTCTTGGGTGGAATTGAACCAAGTTTGTATAAA 78 0 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I 

721 GGATCTGGGACCAACGGAGGTAGTCTTGTCTTGGGTGGAATTGAACCAAGTTTGTATAAA 780 

781 GGAGAC AT CT GGT AT AC C C CT AT T AAGGAAGAGT GGT ACT ACC AGAT AGAAAT T CT GAAA 84 0 

I I I I I I I I M I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

781 GGAGAC AT CT GGT AT AC C C CT AT TAAGGAAGAGT GGT ACT ACC AGAT AGAAAT T CT GAAA 84 0 

841 TT GGAAATT GGAGGCCAAAGC CTTAATCT GGACT GCAGAGAGT ATAACGCAGACAAGGCC 900 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

841 TTGGAAATTGGAGGCCAAAGCCTTAATCTGGACTGCAGAGAGT ATAACGCAGACAAGGCC 900 

901 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

901 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 

961 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 102 0 

I I I I I I I I I I I I I I I M I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

961 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 102 0 

1021 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 1080 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I 
1021 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 1080 

1081 TACCT GAGAGAT GAGAACT CCAGCAGGT CATT CC GTAT CACAAT CCT GCCT CAGCTTTAC 1140 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
1081 TACCT GAGAGAT GAGAACT CCAGCAGGT CATTCCGTAT CACAAT C CT GCCT CAGCTTTAC 1140 

1141 AT T CAGC C CAT GAT GGGGGCCGGC CT GAAT TAT GAAT GT TACC GAT T C GGC AT T T C CCCA 12 00 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1141 AT T CAGC C CAT GAT GGGG GC C GGC CT GAAT TAT GAAT GT TACC GAT T C GGC AT T T C CCCA 1200 

1201 T C C ACAAAT G CGCT GGT GAT C G GT GCCAC G GT GAT GGAGGGCT T CT AC GT CAT CTT CGAC 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1201 T C C ACAAAT GCGCT G GT GAT C GGT GCCAC G GT GAT G GAG GG CT T CT AC GT CAT CT T CGAC 12 60 

1261 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 132 0 

I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1261 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 132 0 

1321 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1321 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1380 

1381 CAGT CT T T GAGCGAG C C CAT T T T GT GGAT T GT GT C CT AT GC GCT CAT GAGC GT CT GT GGA 14 4 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

1381 CAGT CT T T GAGCGAGC C CAT T T T GT GGAT T GT GT C CT AT GC GCT CAT GAGC GT CT GTGGA 144 0 

1441 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I II I I I I I I I I I I 
1441 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 



Qy 1501 C GT GAC C CT GAGGT C GT CAAT GAT GAGT C CT CT CT GGT CAGACAT CGCT GGAAAT GAAT A 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I II I I I I I I I I M 
Db 1501 C GT GAC C CT GAGGT C GT CAAT GAT GAGT C CT CT CT GGT CAGACAT CGCT GGAAAT GAAT A 1560 

Qy 1561 G C CAGG CCT GAC CT CAAGCAAC CAT GAACT C AG CT AT T AAGAAAAT C ACATT T C C AGGGC 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I M I I I I I I I I I I I I I I I I I I I M I I 

Db 1561 GC CAGGCCT GACCT CAAGCAAC CAT GAACT CAG CT ATT AAGAAAAT CACATTT C CAGGGC 1620 

Qy 1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 1680 

Qy 1681 GCTCCCAGATGCCTTCTAGATTCACTGTCTTTTGATTCTTGATTTTCAAGCTTTCAAATC 1740 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1681 GCTCCCAGATGCCTTCTAGATTCACTGTCTTTTGATTCTTGATTTTCAAGCTTTCAAATC 1740 

Qy 1741 CT C C CT ACT T CCAAGAAAAAT AAT T AAAAAAAAAAC T T CAT T CT AAAC CAAAAAAAAAAA 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1741 CT C C CT ACT T CCAAGAAAAAT AAT T AAAAAAAAAAC T T CAT T CTAAAC CAAAAAAAAAAA 18 00 

Qy 1801 AAAA 1804 

I I I I 

Db 1801 AAAA 1804 



RESULT 2 

US-09-548-367D-1 

; Sequence 1, Application US/09548367D 

; Patent No. 6440698 

; GENERAL INFORMATION: 

; APPLICANT: GURNEY ET AL. 

; TITLE OF INVENTION: ALZHEIMER 1 S DISEASE SECRETASE, APP SUBSTRATES THEREFOR 
AND USES 

; TITLE OF INVENTION: THEREOF 

FILE REFERENCE: 29915/6280H 
; CURRENT APPLICATION NUMBER: US/09/548, 367D 
; CURRENT FILING DATE: 2000-04-12 
; PRIOR APPLICATION NUMBER: US 60/155,493 
; PRIOR FILING DATE: 1999-09-23 
; PRIOR APPLICATION NUMBER: US 09/404,133 
; PRIOR FILING DATE: 1999-09-23 
; PRIOR APPLICATION NUMBER: PCT/US99/20881 
; PRIOR FILING DATE: 1999-09-23 
; PRIOR APPLICATION NUMBER: US 60/101,594 
; PRIOR FILING DATE: 1998-09-24 
; NUMBER OF SEQ ID NOS : 73 
; SOFTWARE: Patentln version 3.1 
; SEQ ID NO 1 

LENGTH: 18 04 

TYPE: DNA 
; ORGANISM: Homo sapiens 
US-09-548-367D-1 

Query Match 100.0%; Score 1804; DB 4; Length 1804; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 18 04; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 



1 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 12 0 

121 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 18 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

121 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 180 

181 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 240 

I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

181 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 240 

241 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 300 

I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

241 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 300 

301 CCCCCGCAGAAGCTACAGATTCTCGTTGACACTGGAAGCAGTAACTTTGCCGTGGCAGGA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

301 CCCCCGCAGAAGCTACAGATTCTCGTTGACACTGGAAGCAGTAACTTTGCCGTGGCAGGA 360 

361 AC C C C GC ACT C CT ACAT AGACAC GT ACTT T GAC AC AGAGAG GT CT AG C AC ATACC GCT CC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 

361 AC C C C GC ACT C CT ACAT AGACAC GT ACTT T GAC AC AGAGAGGT CT AG C ACAT ACC GCT CC 420 

421 AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

421 AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 480 

4 81 GACCTCGTCACCATCCCCAAAGGCTTCAATACTTCTTTTCTTGTCAACATTGCCACTATT 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

4 81 GACCTCGTCACCATCCCCAAAGGCTTCAATACTTCTTTTCTTGTCAACATTGCCACTATT 540 

541 T T T GAAT C AGAGAAT TTCTTTTT GCCT GGGAT T AAAT GGAAT GGAAT ACT T G GC CT AGCT 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
541 TTTGAATCAGAGAATTTCTTTTTGCCTGGGATTAAATGGAATGGAATACTTGGCCTAGCT 600 

601 TATGCCACACTTGCCAAGCCATCAAGTTCTCTGGAGACCTTCTTCGACTCCCTGGTGACA 660 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

601 T AT GC CAC AC T T G C CAAGC CAT CAAGTTCT CT G GAGAC CT T CTT C GACT C C CT G GT GACA 660 

661 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

661 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 720 

721 GGAT CT GGGAC CAAC G GAGGT AGT CTTGT CT T GGGT GGAAT T GAAC CAAGT T T GT ATAAA 780 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

721 GGATCTGGGACCAACGGAGGTAGTCTTGTCTTGGGTGGAATTGAACCAAGTTTGTATAAA 780 

781 GGAGACATCTGGTATACCCCTATTAAGGAAGAGTGGTACTACCAGATAGAAATTCTGAAA 840 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

781 GGAGACATCTGGTATACCCCTATTAAGGAAGAGTGGTACTACCAGATAGAAATTCTGAAA 840 

841 T T GGAAAT T GGAG GC CAAAGC CT T AAT CTGGACT GC AGAGAGT AT AAC G CAGACAAGG C C 900 



841 TTGGAAATTGGAGGCCAAAGCCTTAATCTGGACTGCAGAGAGTATAACGCAGACAAGGCC 900 

901 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 

I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I M I I 

901 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 

961 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 

961 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1020 

1021 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 108 0 

I I I I I I I M I I I I I I I I I I II I I I I I I I I I I I I I I I I I M II I I I I I I I I I I I I I I I I I I 

1021 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 1080 

1081 T AC CT GAGAGAT GAGAACT C C AG CAGGT CATT CC GT AT C ACAAT C CT GC CT C AGCT TT AC 1140 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1081 T AC CT GAGAGAT GAGAACT C C AG CAGGT CATT C C GT AT CACAAT C CT GC CT C AG CT T T AC 1140 

1141 AT T CAGCC CAT GAT GGGGGC C GG C CT GAAT TAT GAAT GT T AC C GATT C GG C AT T TCC C C A 1200 

I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
1141 ATTCAGCCCATGATGGGGGCCGGCCTGAATTATGAATGTTACCGATTCGGCATTTCCCCA 1200 

1201 T C CACAAAT GC GCT GGT GAT C GGT GCC AC GGT GAT GGAGGG CT T CT AC GT CAT C TT C GAC 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

1201 T C CACAAAT GC GCT GGT GAT C GGT GCC AC GGT GAT GGAGGG CT T CT AC GT CAT CTT C GAC 1260 

1261 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 1320 

I I I I I I I I I I I I I I I I I I I II I I I II I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
1261 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 1320 

1321 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1321 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1380 

1381 C AGT CTT T GAGC GAGCC CAT T T T GT GGAT T GT GT C CT AT G CGCT CAT GAGC GT CT GT GGA 1440 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1381 C AGT CTT T GAGC GAGCC CAT T T T GT GGAT T GT GT C CT AT GC GCT CAT GAGC GT CT GT GGA 1440 

1441 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 

I I I I I I I I I I I I I I I I I I I II I I I II II I I I I I I I I I I I I I I I I I I I I I I II I I I I M I I 
1441 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 

1501 CGT GACCCT GAGGT CGTCAAT GAT GAGTCCT CT CTGGT CAGACATCGCTGGAAATGAATA 1560 

I I I I I I I I I M I I I I I I I I I I I I I I I I I II II I I I I I II I I I I I I I I I I M I I I I I I I I I 
1501 C GT GACCCT GAGGT CGT CAAT GAT GAGT CCT CTCT GGT CAGACATC GCTGGAAAT GAAT A 1560 

1561 G C CAGGCCT GAC CT CAAGCAAC CAT GAACT CAGCT AT TAAGAAAAT C AC AT T T C CAGGG C 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

1561 G C CAGGCCT GACCT CAAGCAAC CAT GAACT CAGCT AT TAAGAAAAT C ACAT T T C CAGGG C 1620 

1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 1680 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I 

1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 1680 

1681 GCTCCCAGATGCCTTCTAGATTCACTGTCTTTTGATTCTTGATTTTCAAGCTTTCAAATC 1740 
I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 



1681 GCTCCCAGATGCCTTCTAGATTCACTGTCTTTTGATTCTTGATTTTCAAGCTTTCAAATC 1740 



Qy 



1741 CT CCCT ACT T C CAAGAAAAAT AAT T AAAAAAAAAACT T CAT T CTAAAC C AAAAAAAAAAA 18 00 




Db 



1741 CT CCCT AC T T C CAAGAAAAAT AAT T AAAAAAAAAACT T CAT T CTAAAC CAAAAAAAAAAA 1800 



Qy 



1801 AAAA 1804 



Db 



1801 AAAA 1804 



RESULT 3 

US-09-551-853D-1 

; Sequence 1, Application US/09551853D 

; Patent No. 6500667 

; GENERAL INFORMATION: 

; APPLICANT: GURNEY ET AL. 

; TITLE OF INVENTION: ALZHEIMER'S DISEASE SECRETASE, APP SUBSTRATES THEREFOR 
AND USES 

; TITLE OF INVENTION: THEREOF 
; FILE REFERENCE: 29915/6280L 

; CURRENT APPLICATION NUMBER: US/09/551, 853D 

; CURRENT FILING DATE: 2000-04-18 

; PRIOR APPLICATION NUMBER: US 60/155,493 

; PRIOR FILING DATE: 1999-09-23 

; PRIOR APPLICATION NUMBER: US 09/404,133 

; PRIOR FILING DATE: 1999-09-23 

; PRIOR APPLICATION NUMBER: PCT/US99/20881 

; PRIOR FILING DATE: 1999-09-23 

; PRIOR APPLICATION NUMBER: US 60/101,594 

; PRIOR FILING DATE: 1998-09-24 

; NUMBER OF SEQ ID NOS : 73 

; SOFTWARE: Patentln version 3.1 

; SEQ ID NO 1 

LENGTH: 18 04 

TYPE: DNA 

ORGANISM: Homo sapiens 
US-09-551-853D-1 

Query Match 100.0%; Score 1804; DB 4; Length 1804; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 1804; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

Db 1 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

Qy 61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 120 

Qy 121 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 180 



Db 



121 




180 



181 



GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 
I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I II I I I I I I I I I 



240 



Db 



181 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 24 0 



Qy 241 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I 

Db 241 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 300 

Qy 301 CCCCCGCAGAAGCTACAGATTCTCGTTGACACTGGAAGCAGTAACTTTGCCGTGGCAGGA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 301 CCCCCGCAGAAGCTACAGATTCTCGTTGACACTGGAAGCAGTAACTTTGCCGTGGCAGGA 360 

Qy 361 AC C C C GC ACT CCT AC AT AGAC AC GT ACT T T GAC ACAGAGAGGT CT AGCACAT AC CGCT C C 42 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 361 ACC C C GC ACT C CT AC AT AGAC AC GT ACT T T GAC ACAGAGAGGTCTAGCACATAC CGCT C C 420 

Qy 421 AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 480 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 421 AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 4 80 

Qy 481 GACCTCGTCACCATCCCCAAAGGCTTCAATACTTCTTTTCTTGTCAACATTGCCACTATT 54 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4 81 GACCTCGTCACCATCCCCAAAGGCTTCAATACTTCTTTTCTTGTCAACATTGCCACTATT 540 

Qy 541 T T T GAAT CAGAGAAT TTCTTTTTGCCT GG GATT AAAT GGAAT GGAATACTT GGCCT AGCT 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 541 T T T GAAT CAGAGAAT TTCTTTTTGCCT GGGATTAAAT GGAAT GGAATACTT GGCCT AGCT 600 

Qy 601 TATGCCACACTTGCCAAGCCATCAAGTTCTCTGGAGACCTTCTTCGACTCCCTGGTGACA 660 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

Db 601 TATGCCACACTTGCCAAGCCATCAAGTTCTCTGGAGACCTTCTTCGACTCCCTGGTGACA 660 

Qy 661 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 661 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 720 

Qy 721 GGATCT GGGACCAACGGAGGTAGT CTT GTCTT GGGT GGAATTGAACCAAGTTTGTATAAA 780 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 721 G GAT CT G GGAC CAAC G GAGGT AGT CT T GT CTT GGGT GGAATT GAACCAAGTTTGT ATAAA 78 0 

Qy 781 GGAGAC AT CT GGT AT AC C C CT AT TAAG GAAGAGT GGT AC T AC CAGATAGAAATT CT GAAA 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 781 GGAGAC AT CT GGT AT AC C C CT AT TAAG GAAGAGT GGTACT AC CAGATAGAAATT CT GAAA 840 

Qy 841 T T G GAAAT T GGAGGC CAAAGC CT T AAT CT GGACT G C AGAGAGT AT AAC GCAGACAAGGCC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 841 T T GGAAAT T GGAGGC CAAA.GC CT TAAT CT GGACT G CAGAGAGT AT AAC GCAGACAAGGCC 900 

Qy 901 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 901 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 

Qy 961 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 961 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1020 

Qy 1021 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1021 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 1080 



Qy 1081 TACCT GAGAGAT GAGAACT CCAGCAGGT CATTCCGTATCACAAT CCT GCCT CAGCTTTAC 1140 

I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I 

Db 1081 TAG C T GAGAGAT GAGAACT C C AGCAGGT CATT C C GTAT C ACAAT CCT GC CT C AG CTT T AC 1140 

Qy 1141 AT T C AG CC C AT GAT GGGGG CC GGC CTGAAT TAT GAAT GT T AC C GAT T C GGC ATTT CC C CA 12 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! II 
Db 1141 ATT C AGCC C AT GAT GGGGG C C GGC CTGAAT TAT GAAT GT T AC C GAT T C GGC AT T T CC C CA 1200 

Qy 1201 TCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGAC 12 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1201 T C CACAAAT GC GCT G GT GAT C GGT GCC AC G GT GAT GGAG GGCTT CT AC GT CAT CTT C GAC 1260 

Qy 1261 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 1320 

I I I I I I I I II M M I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1261 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 1320 

Qy 1321 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1380 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1321 GT GT C T GAAAT TTCCGGGCCTTT CT CAACAGAGGAT GT AGC CAGCAACT GT GT C CCC GCT 1380 

Qy 1381 C AGT CTT T GAG C GAGC C CAT T T T GT GGAT T GT GT C CT AT GC G CT CAT GAGC GT CTGT GGA 1440 

I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1381 C AGT CTT T GAGC GAGC C CAT T T T GT GGAT T GT GT C CT AT GC G CT CAT GAG C GT CTGT GGA 1440 

Qy 1441 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 

I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1441 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 

Qy 1501 C GT GACCCT GAGGT CGT CAAT GAT GAGT CCT CT CTGGTCAGACATCGCT GGAAATGAATA 1560 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I 
Db 1501 C GT GACCCT GAGGT CGT CAAT GAT GAGT CCT CT CTGGTCAGACATCGCT GGAAATGAATA 1560 

Qy 1561 G C C AGGCCT GACCT CAAGCAAC CAT GAACT C AGCTAT TAAGAAAAT C ACAT T T C C AG GGC 1620 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1561 G C C AGGCCT GACCT CAAGCAAC CAT GAACT C AGCTATTAAGAAAAT C ACAT T T C C AGGGC 1620 

Qy 1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 1680 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I i I I I I I I I I I II I I 

Db 1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 1680 

Qy 1681 GCTCCCAGATGCCTTCTAGATTCACTGTCTTTTGATTCTTGATTTTCAAGCTTTCAAATC 1740 

M I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1681 GCT C CCAGAT GC CT T CT AGATT C ACT GT CT TT T GATT CT T GAT T TT CAAG CT T T CAAAT C 1740 

Qy 1741 CT C C CT ACT T C CAAGAAAAATAAT T AAAAAAAAAACTT CAT T CT AAACCAAAAAAAAAAA 18 00 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1741 C T C C C T ACT T C CAAGAAAAATAAT TAAAAAAAAAACTT CAT T CT AAAC CAAAAAAAAAAA 18 00 

Qy 1801 AAAA 1804 

I I I I 

Db 1801 AAAA 1804 



RESULT 4 

US-09-215-450-18 

; Sequence 18, Application US/09215450 



Patent No. 6635748 
GENERAL INFORMATION: 
APPLICANT: Giese, Klaus 
APPLICANT: Xin, Hong 

TITLE OF INVENTION: METASTATIC BREAST AND COLON CANCER REGULATED GENES 
FILE REFERENCE: 1451.100 / 210030.447 
CURRENT APPLICATION NUMBER: US/09/215, 450 
CURRENT FILING DATE: 1998-12-17 
NUMBER OF SEQ ID NOS : 2 7 

SOFTWARE: FastSEQ for Windows Version 3.0 
SEQ ID NO 18 
LENGTH: 1873 
TYPE: DNA 
ORGANISM: human 
US-09-215-450-18 

Query Match 98.0%; Score 1768.2; DB 4; Length 1873; 

Best Local Similarity 99.8%; Pred. No. 0; 

Matches 1770; Conservative 0; Mismatches 3; Indels 0; Gaps 0; 

Qy 1 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 101 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 160 

Qy 61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 12 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 161 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 220 

Qy 121 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 18 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 221 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 280 

Qy 181 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 24 0 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 281 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 34 0 

Qy 241 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 300 

I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I 

Db 341 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 400 

Qy 301 CCCCCGCAGAAGCTACAGATTCTCGTTGACACTGGAAGCAGTAACTTTGCCGTGGCAGGA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I 

Db 4 01 CCCCCGCAGAAGCTACAGATTCTCGTTGACACTGGAAGCAGTAACTTTGCCGTGGCAGGA 460 

Qy 361 AC CC C G CACT C CT ACAT AGACAC GT ACT T T GAC AC AGAGAGGT CT AGC AC AT AC C GCT C C 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4 61 AC C C C G CACT CCT ACAT AGACAC GT ACT T T GAC ACAGAGAGGT CT AGC AC AT AC C GCT C C 52 0 

Qy 421 AAGGGCTTT GACGT CACAGT GAAGT ACACACAAGGAAGCT GGACGGGCTT CGTT GGGGAA 480 

I I I I I I.I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 521 AAGGGCTTT GACGT CACAGT GAAGT ACACACAAGGAAGCT GGACGGGCTT CGTT GGGGAA 58 0 

Qy 481 GAC CT C GT CAC CAT C CC CAAAGG CT T CAAT AC TTCTTTTCTTGT CAAC AT T GC C ACT AT T 540 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I II 

Db 581 GACCTCGTCACCATCCCCAAAGGCTTC7^ATACTTCTTTTCTTGTCAACATTGCCACTATT 640 



QY 



541 T T T GAAT C AGAGAATT T CTTTTTGCCT GG GAT T AAAT G GAAT GGAAT ACT T GGCCT AGCT 600 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 641 TT T GAAT CAGAGAAT TTCTTTTTGCCT GGGATT AAAT G GAAT GGAAT ACTT GGC CT AGCT 7 00 

Qy 601 TATGCCACACTTGCCAAGCCATCAAGTTCTCTGGAGACCTTCTTCGACTCCCTGGTGACA 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I 

Db 701 T AT GC C ACAC T T GC CAAGC C AT CAAGT T CT CT G GAGAC CT T CT T C GACT CC CT G GT GACA 760 

Qy 661 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 720 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 7 61 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 820 

Qy 721 GGAT CT GGGAC CAAC G GAGGT AGT CT T GT CT T G GGT G GAAT T GAAC CAAGT T T GT AT AAA 7 80 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 
Db 821 GGAT CT GGGAC CAAC G GAGGT AGT CT T GT CT T G GGT GGAAT T GAAC CAAGT T T GT AT AAA 880 

Qy 781 GGAGAC AT CT GGT AT AC C C CT ATTAAGGAAGAGT GGT ACT ACCAGAT AGAAATT CT GAAA 840 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 8 81 GGAGAC AT CT GGT AT AC C C CT ATTAAGGAAGAGT GGT ACT ACCAGAT AGAAATT CT GAAA 94 0 

Qy 841 TT GGAAAT TG GAGG C CAAAGC CTTAAT CT GGACT GC AGAGAGT AT AAC GCAGACAAGGC C 900 

I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 941 TT GGAAAT TG GAGG C CAAAGC C TTAAT CT GGACT GCAGAGAGT AT AAC G CAGACAAGGC C 1000 

Qy 901 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I 

Db 1001 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 1060 

Qy 961 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1020 

M I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1061 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1120 

Qy 1021 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 108 0 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1121 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 1180 

Qy 1081 T AC CT GAGAGAT GAGAACT C C AGCAGGT CAT T C CGT AT CACAAT C CT GC CT C AG CT T TAC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1181 T AC CT GAGAGAT GAGAACT C CAGCAGGT CAT T C CGT AT CACAAT C CT GC CT CAG CT T TAC 124 0 

Qy 1141 AT T C AGC C CAT GAT GG GGGC C G GC CT GAATT AT GAAT GT T AC CGAT T C GGC ATT T C C C C A 1200 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1241 AT T CAG C C CAT GAT GGGGGC C G GCCT GAATT AT GAAT GT TAC CGAT T C GGC ATT T C C C C A 1300 

Qy 12 01 TCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGAC 1260 

I II I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I II I I I I I II I I I I 

Db 1301 TCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGAC 1360 

Qy 1261 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 1361 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 1420 

Qy 1321 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1380 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I II 
Db 1421 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1480 

Qy 1381 C AGT CT TT GAGC GAG C C CAT T T T GT GGAT T GT GT CCT AT GC GCT CAT GAGCGT CT GT GGA 14 4 0 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I II I I I I 



Db 1481 C AGT CTTT GAGC GAG CCCATT T T GT GGAT T GT GT C CT AT GC G CT CAT GAGC GT CT GT GGA 1540 

Qy 1441 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 

I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I 1 I I I I I M I I I 

Db 1541 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1600 

Qy 1501 C GT GAC CCT GAGGT C GT CAAT GAT GAGT C CT CT C T GGT CAGACAT CGCT G GAAAT GAAT A 1560 

I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1601 C GT GAC CCT GAG GT C GT CAAT GAT GAGT C CT CT CT GGT CAGACAT CGCT GGAAAT GAAT A 1660 

Qy 1561 GC C AGGCCT GAC CT CAAG CAAC CAT GAACT CAGCTAT TAAGAAAAT CAC AT TT C CAGG GC 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1661 GC C AGGC CT GAC CT CAAGCAAC CAT GAAC T CAGCTAT TAAGAAAAT CAC AT T T C CAGG GC 1720 

Qy 1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1721 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 1780 

Qy 1681 G CT C C CAGAT GC CT T CT AGAT T CACT GT CTTT T GATT CT T GAT T TT CAAG CT T T CAAAT C 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1781 G CT C C CAGAT GC CT T CT AGAT T CACTGT CTTT T GATT CT T GAT T TT CAAGCT TT CAAAT C 1840 

Qy 1741 CT C C CTACT T C CAAGAAAAAT AAT T AAAAAAAA 1773 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 1841 CTCC CTACT TCCAAGAAAAAAAAAAAAAAAAAA 1873 



RESULT 5 
US-08-999-723-1 

; Sequence 1, Application US/08999723A 

; Patent No. 6025180 

; GENERAL INFORMATION: 

; APPLICANT: Powell, David J. 

; APPLICANT: Southan, Christopher 

; APPLICANT: Chapman, Conrad G. 

APPLICANT: Evans, Joanne R. 
; TITLE OF INVENTION: ASPl 
; FILE REFERENCE: GH70262 

; CURRENT APPLICATION NUMBER: US/08/999, 723A 

; CURRENT FILING DATE: 1997-10-06 

; NUMBER OF SEQ ID NOS : 2 

; SOFTWARE: Patent In Ver. 2.0 

; SEQ ID NO 1 

LENGTH: 18 62 

TYPE: DNA 
; ORGANISM: Homo sapiens 
US-08-999-723-1 

Query Match 97,9%; Score 1765.6; DB 3; Length 1862; 

Best Local Similarity 99.8%; Pred. No. 0; 

Matches 1768; Conservative 0; Mismatches 4; Indels 0; Gaps 0; 

Qy 1 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 91 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 150 



Qy 



61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 120 



151 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 210 

12 1 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

211 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 27 0 

181 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 24 0 

I I I I I I I II I J I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I 

271 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 330 

241 GT AGACAAC CT GC AGGGGGACT C T GGCC GCG G CT ACT AC CT GGAGAT G CT GAT C G G GAC C 300 

II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

331 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 390 

301 C C C C CGCAGAAGCT AC AGATT C T C GT T GACACT GGAAGC AGTAACT T T G C C GT GGCAGGA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I 

391 C C C C CGCAGAAGCT AC AGATT C T C GTT GACACT GGAAGC AGTAACT T T G CC GT GGCAGGA 4 50 

361 AC C C CGCACT C CT ACAT AGAC AC GT ACT T T GAC ACAGAGAGGT CT AGCACAT AC C GC T C C 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

451 AC C C CGCACT C CT ACAT AGAC AC GT ACT TTGAC ACAGAGAGGT CT AGCACAT AC C GCT C C 510 

421 AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 4 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

511 AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 570 

481 GAC CT C GT C AC CAT CC C CAAAGGCTT CAAT ACT T CT T T T CT T GT CAACATT GC C ACT AT T 54 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

571 GAC CT C GT C AC CAT CC C CAAAGGCTT CAAT ACT T CT T T T CT T GT CAACATT GC C ACT AT T 630 

541 TTTGAATCAGAGAATTTCTTTTTGCCTGGGATTAAATGGAATGGAATACTTGGCCTAGCT 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

631 TTTGAATCAGAGAATTTCTTTTTGCCTGGGATTAAATGGAATGGAATACTTGGCCTAGCT 690 

601 TAT GCC ACACT T GC CAAGC CAT CAAGT T CT CT GGAGAC CTT CT T CGACT CC CT GGT GAC A 660 

I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

691 TAT GCC ACACT T GC CAAGC CAT CAAGT T CT CT GGAGAC CTT CT T CGACT CC CT GGT GACA 750 

661 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 720 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

751 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 810 

721 GGAT CT GGGAC CAACGGAG GT AGT CT T GT CT T GG GT GGAAT T GAAC CAAGT T T GT AT AAA 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

811 G GAT CT GGGAC CAACGGAG GT AGT CTT GT CT T GGGT GGAAT T GAAC CAAGT T T GT AT AAA 87 0 

781 G GAGAC AT CT GGT AT AC C C CT AT T AAGGAAGAGT GGT ACT AC CAGAT AGAAAT T CT GAAA 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

871 G GAGAC AT CT GGT AT AC C C CT AT T AAGGAAGAGT GGT ACT AC CAGAT AGAAAT T CT GAAA 930 

841 TT GGAAATT GGAGGCCAAAGCCTTAAT CT GGACT GCAGAGAGTATAACGCAGACAAGGC C 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

931 TT GGAAATT GGAGGCCAAAGCCTTAAT CT GGACT GCAGAGAGTATAACGCAGACAAGGC C 990 

901 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 9 60 
I I I I II I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I II I 



Db 



991 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 1050 



Qy 961 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1020 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I M I I I I I I I II 
Db 1051 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1110 

Qy 1021 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I II I I I I I I I I I I I I I I I I I 

Db 1111 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 1170 

Qy 1081 T ACCT GAGAGAT GAGAACTC CAG CAG GT CAT T C C GT AT CACAAT C CT GC CT CAGCT T T AC 1140 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1171 T AC CT GAGAGAC GAGAACT C CAGCAGGT CAT T C C GT AT CACAAT C CT G C CT CAGCT T T AC 1230 

Qy 1141 ATT CAGC C CAT GAT G GGGGC C GGCCT GAATTAT GAAT GT T AC C GAT T C GGCATT T C C CC A 1200 

I | | I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1231 ATT CAG C CC AT GAT GGGGGC C G GCCT GAATTAT GAAT GT T AC C GAT T C GGC AT T T C C CC A 1290 

Qy 1201 TCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGAC 1260 

I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I 

Db 1291 TCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGAC 1350 

Qy 1261 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 1320 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1351 AGAGC C CAGAAGAGG GT GGGCT T C GC AGC GAGC C C CT GT GCAGAAATT GC AGGT GCT GC A 1410 

Qy 1321 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1411 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1470 

Qy 1381 CAGT CT T T GAGC GAGC C CAT T T T GT G GAT TGT GT C CT AT GC GCT CAT GAGC GT CT GT G GA 144 0 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I 
Db 1471 CAGT CT T T GAGC GAGC C CAT T T T GT GGAT T GT GT C CT AT GC GCT CAT GAGC GT CT GT GGA 1530 

Qy 1441 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 

I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I II I II I 

Db 1531 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1590 

Qy 1501 C GT GAC C CT GAGGT C GT CAAT GAT GAGT C CT CT CT GGT CAGAC AT CGCT GGAAAT GAAT A 1560 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 1591 CGTGACCCT GAGGTC GT CAAT GAT GAGT CCT CT CT GGT CAGACAT CGCTGGAAAT GAAT A 1650 

Qy 1561 G C CAGGC CT GAC CT CAAGCAAC CAT GAACT CAGCT AT TAAGAAAAT C ACATTT C CAGGGC 1620 

I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I 
Db 1651 G C CAGGC CT GAC CT CAAGCAAC CAT GAACT CAG CT AT TAAGAAAAT CACAT T T C CAGGGC 1710 

Qy 1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 1680 

I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 1711 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 1770 

Qy 1681 G CT C C CAGAT GC CTT CT AGAT T CACT GT CTT TT GATT CT T GAT T TT CAAGCT TT CAAAT C 17 4 0 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 1771 GCT C C CAGAT GC CTT CT AGAT T CACT GT CT T T T GATT CT T GAT TT T CAAGCT TT CAAAT C 1830 

Qy 1741 CT CC CT ACT T C CAAGAAAAATAATTAAAAAAA 1772 

II I I I I I I I I M I I I I I I I I II II I I I I I 

Db 1831 CTCCCTACTTCCAAGAAAAAAAAAAAAAAAAA 1862 



RESULT 6 
US-09-434-427-1 

; Sequence 1, Application US/09434427 

; Patent No. 6162630 

; GENERAL INFORMATION: 

; APPLICANT: POWELL, DAVID J. 

; APPLICANT: SOUTHAN, CHRISTOPHER 

; APPLICANT: CHAPMAN, CONRAD G. 

; APPLICANT: EVANS , JOANNE R . 

; TITLE OF INVENTION: ASP1 

FILE REFERENCE: GH-70262-D1 
; CURRENT APPLICATION NUMBER: US/ 09/434 , 427 

CURRENT FILING DATE: 1999-11-04 

EARLIER APPLICATION NUMBER: US 08/999,723 
; EARLIER FILING DATE: 1997-10-06 
; EARLIER APPLICATION NUMBER: UK 962 6022.9 
; EARLIER FILING DATE: 1996-12-14 
; NUMBER OF SEQ ID NOS : 2 

; SOFTWARE: FastSEQ for Windows Version 3.0 

; SEQ ID NO 1 

; LENGTH: 1862 

; TYPE: DNA 

ORGANISM: HOMO SAPIENS 
US-09-434-427-1 

Query Match 97.9%; Score 1765.6; DB 3; Length 1862; 

Best Local Similarity ,99.8%; Pred. No. 0; 

Matches 1768; Conservative 0; Mismatches 4; Indels 0; Gaps 0; 

Qy 1 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 91 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 150 

Qy 61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 151 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 210 

Qy 121 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 211 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 270 

Qy 181 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 240 

. I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 271 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 330 

Qy 241 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 300 

I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 1 I I I I II 

Db 331 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 390 

Qy 301 CCCCCGCAGAAGCTACAGATTCTCGTTGACACTGGAAGCAGTAACTTTGCCGTGGCAGGA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 391 CCCCCGCAGAAGCTACAGATTCTCGTTGACACTGGAAGCAGTAACTTTGCCGTGGCAGGA 450 

Qy 361 AC C C C GC ACT C CTACAT AGAC AC GT ACT T T GACAC AGAGAGGT CT AGC ACAT AC C G CT C C 420 

II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I II I I I I I I I I I I I I 



Db 451 AC C CC GCACT CCT ACAT AGACAC GT AC T T T GACAC AGAGAG GT C T AGCACAT ACC GCT C C 510 

Qy 421 AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I i I I I I I II I I I I II I I I I I I I I I II I I I 

Db 511 AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 570 

Qy 481 GAC CT C GT CACCAT C C C CAAAG GC T T CAATACT T CT T T T CT T GT CAAC AT T GC CACT AT T 54 0 

I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 571 GAC CT C GT CAC CAT C C C CAAAGGCT T CAATACT T CT T T T CT T GT CAAC AT T GC CACT AT T 630 

Qy 541 TTTGAATCAGAGAATTTCTTTTTGCCTGGGATTAAATGGAATGGAATACTTGGCCTAGCT 600 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 631 T T T GAAT CAGAGAAT TTCTTTTTGCCT GGGATTAAAT GGAAT GGAAT ACT T G G C CT AGCT 690 

Qy 601 TAT GC CAC ACT T GC CAAGC C AT CAAGT T CT CT GGAGAC CT T C T T C GACT C C CT GGT GACA 660 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 691 TAT GC C ACACT T GC CAAGC CAT CAAGT T CT CT GGAGAC CT T C T T C GACT C CCT GGT GACA 750 

Qy 661 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 72 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 751 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 810 

Qy 721 GGATCTGGGACCAACGGAGGTAGTCTTGTCTTGGGTGGAATTGAACCAAGTTTGTATAAA 780 

I I I I I I I I I II I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 811 GGATCTGGGACCAACGGAGGTAGTCTTGTCTTGGGTGGAATTGAACCAAGTTTGTATAAA 87 0 

Qy 7 81 GGAGACAT CTGGT ATACCCCTATTAAGGAAGAGT GGT ACT ACCAGATAGAAATT CT GAAA 840 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 871 GGAGACAT CTGGT ATACCCCTATTAAGGAAGAGT GGT ACT ACCAGATAGAAATT CT GAAA 930 

Qy 841 TTGGAAATTGGAGGCCAAAGCCTTAATCTGGACTGCAGAGAGTATAACGCAGACAAGGCC 900 

I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

Db 931 TTGGAAATTGGAGGCCAAAGCCTTAATCTGGACTGCAGAGAGTATAACGCAGACAAGGCC 990 

Qy 901 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 991 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 1050 

Qy 961 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1020 

I I I I I I I I I I II I I I I I II I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 1051 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1110 

Qy 1021 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 10 8 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I II I I I I I I 

Db 1111 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 1170 

Qy 1081 T AC CT GAGAGAT GAGAACT C C AGC AGGT CAT T C C GT AT CACAAT C CT GC CT C AGC TT T AC 114 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1171 T AC CT GAGAGAC GAGAACT C C AGC AGGT CAT T C C GT AT CACAAT C CT GC CT CAGC TT T AC 1230 

Qy 1141 ATTCAGCCCATGATGGGGGCCGGCCTGAATTATGAATGTTACCGATTCGGCATTTCCCCA 12 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1231 AT T CAGC C CAT GAT GGG GGC C GG C CT GAAT TAT GAAT GTT AC C GATT C GGC ATT T C C C CA 1290 

Qy 1201 TCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGAC 1260 

I I I I I I II I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

Db 1291 TCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGAC 1350 



Qy 1261 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I ! I I I I I I I I I I I I M I I I I M I I 
Db 1351 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 1410 

Qy 1321 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I M I I I I I I I I 
Db 1411 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1470 

Qy 1381 CAGTCTTTGAGCGAGCCCATTTTGTGGATTGTGTCCTATGCGCTCATGAGCGTCTGTGGA 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I II I I I I I I I I 
Db 1471 CAGT C T T TGAGC GAGC C CAT T T T GT GGAT T GT GT C CT AT G C GCT CAT GAGC GT CT GT GGA 1530 

Qy 1441 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1531 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1590 

Qy 1501 C GT GAC C CT GAGGT C GT CAAT GAT GAGT C CT C T CT GGT CAGACAT C GCT GGAAAT GAAT A 1560 

I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1591 C GT GAC C CT GAGGT C GT CAAT GAT GAGT C CT CT CT GGT CAGACAT C GCT GGAAAT GAAT A 1650 

Qy 1561 GCC AGGC CT GAC CT CAAGCAAC CAT GAACT CAGCT AT T AAGAAAAT CAC AT T T C C AGGGC 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1651 GCC AGGC CT GAC CT CAAGCAAC CAT GAACT CAGCT AT TAAGAAAAT CAC AT T T C CAGGGC 1710 

Qy 1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 168 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II M I I I I I I I I I I I I I I 

Db 1711 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 1770 

Qy 1681 GCT C C C AGAT GC CT T CT AGATT C ACT GT C TTT T GATT CT T GAT T T T CAAG CT T T CAAAT C 174 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 1771 GCT C C C AGAT GC CT T CT AGATT CACT GT CTT T T GATT CT T GAT TTT CAAGCTT T CAAAT C 1830 

Qy 1741 CT C C CT ACT T C CAAGAAAAAT AAT TAAAAAAA 1772 

II I I I I I I I I I I I II II I I I II I I I I I I I 

Db 1831 CTCCCTACTTCCAAGAAAAAAAAAAAAAAAAA 1862 
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Query Match 82.0%; Score 1478.6; DB 4; Length 2429; 

Best Local Similarity 99.4%; Pred. No . 0 ; 

Matches 1484; Conservative 0; Mismatches 9; Indels 0; Gaps 0; 

Qy 305 C GCAGAAGCT AC AGAT T CT C GT T GACACT GGAAGC AGTAACT T T GCC GT GGC AGGAAC C C 364 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

Db 213 CT CAC C AG CT AC AGAT T CT C GT T GACAC T G GAAGC AGTAACT T T GCC GT GCAGGAAAC C C 272 

Qy 365 C GCACT C CTACATAGACACGT ACT TT GACAC AGAGAGGT CT AG CACAT AC C GCT C CAAGG 424 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 
Db 273 C GCACT CCT AC ATAGAC AC GT ACT TT GACAC AGAGAGGT CT AG CACAT AC C GCT C CAAG G 332 

Qy 425 GCTT T GAC GT C ACAGT GAAGT AC ACACAAGGAAG CT GGAC GGGCTTCGTT G GGGAAGAC C 484 

I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 333 GCTT T GAC GT C ACAGT GAAGT AC ACACAAGGAAG CT G GAC GGGCT T C GT T G GGGAAGAC C 392 

Qy 485 TCGTCACCATCCCCAAAGGCTTCAATACTTCTTTTCTTGTCAACATTGCCACTATTTTTG 544 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 393 TCGTCACCATCCCC7WVGGCTTCAATACTTCTTTTCTTGTCAACATTGCCACTATTTTTG 452 

Qy 545 AATCAGAGAATTTCTTTTTGCCTGGGATTA7\ATGGAATGGAATACTTGGCCTAGCTTATG 604 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 453 AATCAGAGAATTTCTTTTTGCCTGGGATTAAATGGAATGGAATACTTGGCCTAGCTTATG 512 

Qy 605 C CACACT T G C CAAGC C AT CAAGT T CT CT GGAGAC CT T CTT C GAC T CC CT GGT GAC ACAAG 664 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 513 C CACACTT G C CAAG CC AT CAAGT T CT CT GGAGAC CT T CTT C GACT CC CT GGT GAC ACAAG 572 

Qy 665 CAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCTGGAT 724 

I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I M I I I II I I I I I I I I I I I 

Db 573 CAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCTGGAT 632 

Qy 725 CT GGGAC CAAC GGAGGT AGT CT T GT CT T GGGTGGAAT T GAAC CAAGT T T GT AT AAAGGAG 784 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I 

Db 633 CTGGGACCAACGGAGGTAGTCTTGTCTTGGGTGGAATTGAACCAAGTTTGTATAAAGGAG 692 

Qy 785 ACAT CT G GT AT AC C C CT AT TAAGGAAGAGT GGT ACT AC CAGAT AGAAAT T CT GAAAT T GG 84 4 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I 

Db 693 ACAT CT GGT AT ACC C CT AT TAAGGAAGAGT G GTACT AC CAGAT AGAAAT T CT GAAAT T GG 752 

Qy 845 AAATT GGAGGCCAAAGCCTTAAT CTGGACT GCAGAGAGTATAAC GCAGACAAGGCCAT CG 904 

I I I II I I I I I I I I I I I I I II I M I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 753 AAATT G GAGGCCAAAGC CT TAAT CT GGACT GC AGAGAGT AT AAC GCAGACAAGGC CAT C G 812 

Qy 905 TGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTGGAAG 964 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II M I I I I I I I I I I 

Db 813 TGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTGGAAG 872 

Qy 965 CTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCCCAGC 1024 

I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 873 CTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCCCAGC 932 

Qy 1025 TGGCGTGCT GGAC GAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATCT ACC 1084 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 933 TGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATCTACC 992 

Qy 1085 T GAGAGAT GAGAACT C C AGCAGGT CAT T C C GT AT C ACAAT C CT G CCT C AGCT T TAC AT T C 1144 



Db 



993 



1052 



Qy 1145 AGC C CAT GAT GGGGGC CG GC CT GAAT TAT GAAT GT T AC C GAT T C G GC ATT T C C CC AT C C A 1204 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I M I I I I II II I 

Db 1053 AGCCCATGATGGGGGCCGGCCTGAATTATGAATGTTACCGATTCGGCATTTCCCCATCCA 1112 

Qy 1205 C AAAT G C G CT GGT GAT C GGT GC CACGGT GAT GGAGGGCT T CT AC GT CAT CT T C GACAGAG 12 64 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 1113 CAAAT GC GCT GGT GAT C GGT GC CACGGT GAT G GAGGG C T T CT AC GT CAT CT T C GACAGAG 1172 

Qy 1265 CCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCAGTGT 1324 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 1173 CCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCAGTGT 1232 

Qy 1325 CTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCTCAGT 1384 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II 

Db 1233 CTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCTCAGT 1292 

Qy 1385 C T T T GAGC GAGCC C AT T TT GT GGATT GT GT CCT AT GC GCT CAT GAGCGT CT GT GGAGC CA 1444 

I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II 

Db 1293 C T T T GAG C GAGCC CAT T TT GT G GATT GT GT C CT AT GC GCT CAT GAGCGT CT GT GGAGC CA 1352 

Qy 1445 TCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCCCGTG 1504 

I I I I I I I I I I I I I I I I II I I I I I M I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I 

Db 1353 TCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCCCGTG 1412 

Qy 1505 AC C CT GAGGT C GT CAAT GAT GAGT CCT CT CT G GT C AGACAT C GCT GGAAAT GAAT AG C CA 1564 

I I I I I I I I I II I I I I I I II I I I I 11 I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 1413 AC C CT GAGGT C GT CAAT GAT GAGT CCT CT CT G GT CAGACAT C GCT GGAAAT GAAT AGC CA 1472 

Qy 1565 G GC CT GAC CT CAAGCAAC CAT GAACT C AGCT AT T AAGAAAAT CAC ATT T C CAGGGCAGC A 162 4 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1473 GGC CT GAC CT CAAGCAAC CAT GAACT C AG CT ATT AAGAAAAT CAC ATT T CCAGGGCAGC A 1532 

Qy 1625 GCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCTGCTC 1684 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1533 GCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCTGCTC 1592 

Qy 1685 C C AGAT GC CT T CT AGATT C ACT GT CT T T T GATT CT T GAT TT T CAAGCT T T CAAAT C CT C C 1744 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

Db 1593 C C AGAT GC CT T CT AGATT C ACT GT CT T TT GATT CT T GAT TT T CAAGCT T T CAAAT C CT C C 1652 

Qy 1745 CTACTTCCAAGAAAAATAATTAA7WW\AAACTTCATTCTAAACCAAAAAAAA 17 97 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1653 C T AC T T C C AAGAAAAAT AAT T AAAAAAAAAAC T T CAT T C T AAAC CAAAAC AGA 1705 



RESULT 8 
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TITLE OF INVENTION: Mouse Aspartic Secretase-1 (mASPl) 
FILE REFERENCE: GP-70663 

CURRENT APPLICATION NUMBER: US/ 09/7 17 , 4 32 
CURRENT FILING DATE: 2000-11-21 
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Query Match 62.9%; Score 1134.2; DB 3; Length 1545; 

Best Local Similarity 83.6%; Pred. No. 5.5e-260; 

Matches 1302; Conservative 0; Mismatches 2 43; Indels 12; Gaps 1; 

Qy 1 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1 ATGGGCGCGCTGCTTCGAGCACTCTTGCTCCTGGTGCTGGCGCAGTGGCTCTTGAGTGCG 60 

Qy 61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 120 

I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

Db 61 GTCCCCGCGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCAAGTGGCCGGGGCCACGAAC 12 0 

Qy 121 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 18 0 

II II III I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 121 CACAGAGCCTCGGCTGTTCCCGGACTCGGGACCCCCGAGTTGCCCCGGGCCGATGGTCTG 18 0 

Qy 181 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 24 0 

II I I I I I II I I I II I I I I III I I I I I I I I I I I I I I I III 

Db 181 GCCCTCGCACTGGAGCCTGTCAGGGC TACTGCCAACTTCTTGGCTATG 22 8 

Qy 241 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 300 

II I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 22 9 GTGGACAACCTTCAGGGGGACTCTGGCCGCGGCTACTACCTAGAGATGCTGATCGGGACC 28 8 

Qy 301 CC C C C G C AGAAGCT AC AGAT T CT CGT T GAC ACT GGAAGC AGT AACT T T GC CGT GG C AGGA 360 

II I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 28 9 CCTCCGCAGAAGGTACAGATTCTTGTGGACACTGGAAGCAGTAACTTCGCTGTGGCAGGT 34 8 

Qy 361 AC C C C GC ACT C CT AC AT AGAC AC GT ACT T T GACAC AGAGAG GT CT AGC AC AT AC C GCT CC 42 0 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II MINIMI I M I 
Db 34 9 GC C C C ACACT C CT AC AT AGAC AC CT ACT T T GACT C AGAGAG CT C C AGC AC AT AC C ACT CC 408 

Qy 421 AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 480 

I I I I I I I I I I I Mill I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I II 
Db 4 09 AAGGGCTTTGATGTCACTGTGAAGTACACACAGGGAAGCTGGACTGGCTTTGTTGGTGAG 468 

Qy 481 GAC CT C GT CAC CAT C C C CAAAGGCTT CAAT ACTT CT T T T CT T GT CAAC ATT GC CACT ATT 54 0 

I I I II II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I II I I I 

Db 4 69 GACCTTGTCACCATCCCAAAAGGCTTCAACAGCTCTTTCTTGGTCAATATTGCCACTATT 528 

Qy 541 TTTGAATCAGAGAATTTCTTTTTGCCTGGGATTAAATGGAATGGAATACTTGGCCTAGCT 600 

II II II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II III 

Db 52 9 TT C GAGT CT GAGAAT TTCTTTTTGCCTG GT AT T AAAT GGAAT GGAAT CCTT GGACT T GCT 58 8 



601 TATGCCACACTTGCCAAGCCATCAAGTTCTCTGGAGACCTTCTTCGACTCCCTGGTGACA 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II II I I I I I I I I I I 

589 TATGCTGCTTTGGCCAAGCCATCAAGCTCTCTGGAGACATTTTTTGATTCCCTGGTGGCC 64 8 

661 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 72 0 

I I I I I I I I II II II I I I I I I I I I I I I I I I I I I I II II II I I I I I II Ml 

649 CAAG CAAAGAT T C C AGAC AT T T T CTC C AT GC AGAT GTGCGGGGCT GGAT T GC C AGT AGCT 708 

721 GGATCTGGGACCAACGGAGGTAGTCTTGTCTTGGGTGGAATTGAACCAAGTTTGTATAAA 78 0 

II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

7 09 GGTTCTGGTACCAACGGAGGTAGTCTTGTCCTGGGTGGGATTGAACCAAGTTTGTATAAA 768 

781 GGAGACAT CT G GT AT AC CC CT AT TAAG GAAGAGT GGT ACT AC CAGAT AGAAAT T CT GAAA 84 0 

I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I II I I I I I I I I I I I I I 

7 69 GGAGAT AT CT GGT AT AC CC CAAT T AAAGAGGAAT G GT ACT AT CAAAT AGAAAT CCT GAAG 82 8 

841 T T GGAAAT T G GAGGC CAAAGC CTT AAT CT G GACT GCAGAGAGT ATAAC GC AGACAAGGC C 900 

I I I I I I I I I I I I I I I I I I III II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

82 9 T T GGAAAT T G GAGGC CAGAAC CT CAAC CT G GACT G CAGAGAGT ATAAC GC AGACAAGGC C 88 8 

901 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 

II I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

889 AT T GT GGACAGT GGC AC C AC GCT CCT GC GC CT GC C C C AGAAG GT GT T T GAT GC AGTGGT G 94 8 

961 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1020 

I I I I I I I I I I I II I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I III II 

94 9 GAAG CT GT GGC AC GAAC AT CT CT GAT T C C AGAGT TT T CT GAT GGCT T CT GGAC AGGGGC C 1008 

1021 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I II III I II I II I II I I II II II I 

1009 C AGC T GGC AT GCT GGACAAAT T CT GAAAC GCC AT GGGCAT AT TT C C CT AAGAT TT CT AT C 1068 

1081 T ACCT GAGAGATGAGAACT CCAGCAGGT CATT CCGTAT CACAAT CCT GCCT CAGCTTT AC 1140 

I I I I II I II I I I I I I I I I I I I I II I I I I I II I I I II II II I I I I I III 

1069 T AC CT GAGAGAT GAGAAT GC CAGT CGCTCCTTC C GGAT C AC CAT T CT C C C AC AGCTCT AC 1128 

1141 AT T CAGC C CAT GAT GGGGGC C GGCCT GAAT TAT GAAT GT T AC CGAT T C GGC AT TT CC C C A 12 00 

I I I I II I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I II II II III I 

1129 ATTCAGCCCATGATGGGAGCTGGTTTCAATTATGAATGCTACCGTTTTGGTATCTCCTCT 118 8 

1201 TCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGAC 1260 

I I I I I I I I I I I I I I II I I I I I I I II II II I I I I II I I I I I I I I I I I I I I I III 

1189 TCCACAAATGCGCTGGTGATTGGTGCGACCGTGATGGAAGGCTTCTACGTGGTCTTTGAC 124 8 

1261 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I MM MM I II 

124 9 AGAG CT C AGAGGAGGGT GGGCT T T GC AGT GAGT C C CT GT GCAGAGAT T GAAGGT AC C AC A 1308 

1321 GTGTCTGA7VATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 138 0 

II I II I II I M I II Mill II II II II II II I I I II I I I II I II I II II 

1309 GTGTCTGAAATTTCTGGGCCCTTTTCCACGGAAGACATAGCCAGCAACTGTGTTCCAGCA 1368 

1381 CAGT CTT T GAGCGAGC C CAT T T T GT G GAT T GT GT C CT AT G CGCT CAT GAGC GT CT GT G GA 1440 

III II Ml II I I II II I I II II I I II II I I I II I I I II I I II I M II I I I I 

1369 CAGGCTCTGAATGAGCCCATCTTGTGGATTGTGTCCTATGCCCTGATGAGTGTGTGTGGA 142 8 



Qy 1441 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I 

Db 1429 GCCATTCTCCTGGTTCTGATCCTCCTCCTGCTGCTCCCGCTGCACTGCCGTCATGCCCCC 1488 

Qy 1501 C GT GAC C CT GAGGT C GT CAAT GAT GAGT C CT CT CT GGT CAGACAT C GCT GGAAAT GA 1557 

II I I I I I I I I I I I II II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

Db 148 9 C GAGAC C CT GAGGT AGT T AAC GAT GAGT C CT CACT AGT CAGACAT C GCT GGAAAT GA 1545 



RESULT 9 
US-09-912-484-1 

Sequence 1, Application US/09912484 
Patent No. 6358725 
GENERAL INFORMATION: 
APPLICANT: Christie, Gary 
APPLICANT: Li, Xiaotong 
APPLICANT: Powell, David J. 
APPLICANT: Zhu, Yuan 

TITLE OF INVENTION: Mouse Aspartic Secretase-1 (mASPl) 
FILE REFERENCE: GP-70663-D1 
CURRENT APPLICATION NUMBER: US/09/912,484 
CURRENT FILING DATE: 2001-07-25 
PRIOR APPLICATION NUMBER: 60/166,974 
PRIOR FILING DATE: 1999-11-23 
PRIOR APPLICATION NUMBER: 09/717,432 
PRIOR FILING DATE: 2000-11-21 
NUMBER OF SEQ ID NOS : 2 

SOFTWARE: Fast SEQ for Windows Version 3.0 
SEQ ID NO 1 
LENGTH: 1545 
TYPE: DNA 

ORGANISM: MUS MUSCULUS 
US-09-912-484-1 

Query Match 62.9%; Score 1134.2; DB 4; Length 1545; 

Best Local Similarity 83.6%; Pred. No. 5.5e-260; 

Matches 1302; Conservative 0; Mismatches 243; Indels 12; Gaps 1; 

Qy 1 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 1 ATGGGCGCGCTGCTTCGAGCACTCTTGCTCCTGGTGCTGGCGCAGTGGCTCTTGAGTGCG 60 

Qy 61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 120 

I III I I I II I I I I I I I M I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I 

Db 61 GTCCCCGCGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCAAGTGGCCGGGGCCACGAAC 120 

Qy 121 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 180 

II II III I I I I I I I I I I I I I II I I I I I I I! I I I I II 

Db 121 CACAGAGCCTCGGCTGTTCCCGGACTCGGGACCCCCGAGTTGCCCCGGGCCGATGGTCTG 180 

Qy 181 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 240 

I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I 

Db 181 GCCCTCGCACTGGAGCCTGTCAGGGC TACTGCCAACTTCTTGGCTATG 228 

Qy 241 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 300 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

Db 22 9 GTGGACAACCTTCAGGGGGACTCTGGCCGCGGCTACTACCTAGAGATGCTGATCGGGACC 288 



Qy 301 CCCCCGCAGAAGCTACAGATTCTCGTTGACACTGGAAGCAGTAACTTTGCCGTGGCAGGA 360 

II I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I II I I I I I I I I 

Db 28 9 CCTCCGCAGAAGGTACAGATTCTTGTGGACACTGGAAGCAGTAACTTCGCTGTGGCAGGT 348 

Qy 361 AC C CC GCACT CCT AC AT AGAC AC GT ACT TT GAC ACAGAGAGGT CT AGC AC ATAC C GCT C C 42 0 

I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I II II I I I I II I I I I I I I I 

Db 34 9 GCCCCACACT CCTACATAGACACCTACTTTGACT CAGAGAGCTCCAGCACATACCACT CC 408 

Qy 421 AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 4 8 0 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II 

Db 4 09 AAGGGCTTTGATGTCACTGTGAAGTACACACAGGGAAGCTGGACTGGCTTTGTTGGTGAG 4 68 

Qy 4 81 GAC CT C GT CACC AT C C C CAAAGG CTT CAAT ACTT CTTTTCTTGT CAAC AT T GC CACT ATT 540 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

Db 4 69 GAC CT T GT CACC AT C C CAAAAGG CTT CAAC AGCT CT T T CT T GGT CAAT AT T GC CACT ATT 52 8 

Qy 541 TT T GAAT C AGAGAAT T T CT TTTTGCCT G GGATTAAAT GGAAT GGAAT ACT T G GCCT AG CT 600 

II II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II III 

Db 52 9 TT C GAGT CT GAGAAT T T CT TTTTGCCT GGT ATTAAAT GGAAT GGAAT C CT T GGACT T GCT 58 8 

Qy 601 TAT GC C AC ACTT GC CAAGC CAT CAAGT T CT CTGGAGAC CT T C TT C GACT C C C T GGT GACA 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II II I I I I I I I I I I 

Db 58 9 TATGCTGCTTTGGCCAAGCCATCAAGCTCTCTGGAGACATTTTTTGATTCCCTGGTGGCC 64 8 

Qy 661 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 720 

I I I I I I I I II II II I I I I I I I I I I I I I I I I I I I II II II I I I I I II III 

Db 64 9 CAAGCAAAGATT C C AGAC ATTT T CT CC AT G CAGAT GT GC GGG GCT GGAT T GC CAGT AGCT 7 08 

Qy 721 GGATCTGGGACCAACGGAGGTAGTCTTGTCTTGGGTGGAATTGAACCAAGTTTGTATAAA 780 

II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 709 GGTTCTGGTACCAACGGAGGTAGTCTTGTCCTGGGTGGGATTGAACCAAGTTTGTATAAA 768 

Qy 781 GGAGACAT CT GGTATACCCCTATTAAGGAAGAGT GGTACTAC CAGAT AGAAAT T CT GAAA 84 0 

I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I II I I I I I I I I I I I I I 

Db 769 GGAGATAT CTGGTATACCCCAATTAAAGAGGAAT GGTACTAT CAAAT AGAAAT CCT GAAG 82 8 

Qy 841 TTGGAAATTGGAGGCCAAAGCCTTAATCTGGACTGCAGAGAGTATAACGCAGACAAGGCC 900 

I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 829 T T GGAAAT T G GAGGC C AGAAC CT CAACCT GGACT GCAGAGAGT ATAAC GCAGACAAGGC C 88 8 

Qy 901 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 

II I I M I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I II I I I I I I I I I I I I I I 

Db 889 ATTGTGGACAGTGGCACCACGCTCCTGCGCCTGCCCCAGAAGGTGTTTGATGCAGTGGTG 94 8 

Qy 961 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1020 

I I I I I I I II I I II I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I Ml II 

Db 94 9 GAAGCTGTGGCACGAACATCTCTGATTCCAGAGTTTTCTGATGGCTTCTGGACAGGGGCC 1008 

Qy 1021 CAGCT GGCGT GCT GGACGAATTCGGAAACACCTT GGT CTTACTTCCCTAAAATCTC CATC 108 0 

II I I I I I I I I I I I I I I I I I I I I I I I I II III I II I I I I I I I I II II III 

Db 1009 CAGCT GGC AT GCT G GACAAAT T CT GAAAC GC CAT GGG CAT AT T T C C CT AAGATT T CT AT C 1068 

Qy 1081 T AC CT GAGAGAT GAGAACT C C AGCAGGT CAT T C C GT AT CACAAT C CT GC CT CAGCT TT AC 114 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1069 T AC CT GAGAGAT GAGAAT GC CAGT C GCT C CT TC C GGAT CAC CAT T CT C C CACAGCT CT AC 1128 



Qy 

Db 



1141 
1129 



1200 
1188 



Qy 1201 TCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGAC 1260 

I I I I I I I I I I I I I I I I II I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I Ml 

Db 118 9 TCCACAAATGCGCTGGTGATTGGTGCGACCGTGATGGAAGGCTTCTACGTGGTCTTTGAC 1248 

Qy 1261 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I II I I I I I I I I I I I I M 

Db 1249 AGAGCT CAGAGGAG GGT GGGCTTTG C AGT GAGT C C CT GT GC AGAGAT T GAAGGT ACC ACA 1308 

Qy 1321 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1380 

I I I I I I I I I I II I I I I I I I II II II II II I I I I I I I I I I I I I I I I II II 

Db 1309 GT GT CT GAAAT TTCTGGGCCCTTTTC C ACGGAAGAC AT AGC C AGCAACT GTGTT C CAGCA 1368 

Qy 1381 CAGTCTTTGAGCGAGCCCATTTTGTGGATTGTGTCCTATGCGCTCATGAGCGTCTGTGGA 1440 

III II III I I I I I I I I I I I I I I I I I I I I I I I I I I I I II MMI II I I I I I I 

Db 1369 CAGGCTCTGAATGAGCCCATCTTGTGGATTGTGTCCTATGCCCTGATGAGTGTGTGTGGA 142 8 

Qy 1441 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III II I I I I 

Db 1429 GCCATTCTCCTGGTTCTGATCCTCCTCCTGCTGCTCCCGCTGCACTGCCGTCATGCCCCC 148 8 

Qy 1501 C GT GAC C CT GAGGT C GT CAAT GAT GAGT CCT CT CT GGT C AGAC AT C GCT GGAAAT GA 1557 

II I I I I I II II I I II II I I I I I I I I II I II I I I I I I I I I I I M I I I I II I I 

Db 148 9 C GAGAC CCT GAGGT AGT TAAC GAT GAGT CCT CACT AGT C AGAC AT C GCT G GAAAT GA 1545 



RESULT 10 
US-09-280-116-32 

Sequence 32, Application US/09280116A 
Patent No. 6331427 
GENERAL INFORMATION: 
APPLICANT: Robison, Keith E. 

TITLE OF INVENTION: Nucleic Acid Molecules Encoding Human Protease Homologs 
FILE REFERENCE: 5800-24, 035800/17 6965 
CURRENT APPLICATION NUMBER: US/ 09/2 8 0 , 116A 
CURRENT FILING DATE: 1999-03-26 
NUMBER OF SEQ ID NOS : 268 
SOFTWARE: PatentlnVer. 2.0 
SEQ ID NO 32 
LENGTH: 2514 
TYPE: DNA 

ORGANISM: Homo sapiens 
FEATURE : 

; OTHER INFORMATION: aspartyl proteases 
US-09-280-116-32 

Query Match 61.2%; Score 1104.6; DB 4; Length 2514; 

Best Local Similarity 92.9%; Pred. No. 7.1e-253; 

Matches 142 8; Conservative 0; Mismatches 64; Indels 45; Gaps 24; 

Qy 305 C GC AGAAGCTACAGAT T CT C GT T GACACT GGAAGCAGT AACTT T GC C GT GGCAGGAAC C C 364 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I 

Db 213 CT C AC C AGCT ACAGAT T CT C GT T GAC ACT GGAAG CAGT AACTT T GC C GT GG- AGGAAC C C 271 



Qy 365 C GC ACT CCT ACAT AGACAC GT ACT T T GAC ACAGAGAG GT CT AGCAC AT AC C G CT C CAAGG 42 4 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M M I I I 

Db 272 CGCACT CCTACAT AGACAC GTACTTTGACACAGAGAGGT CTAGCACAT AC C GCT CCAAGG 331 

Qy 425 GCT T T GAC GT C ACAGT GAAGT ACACACAAGGAAG CT G GAC GG GCT T C GT T GGGGAAGACC 484 

I I I I I I M II I I I I I I I I II I I I I II I I I M I I I I I I I I II I I I II I I I I I I I I I I I I I I 

Db 332 GCT T T GAC GT C AC AGT GAAGT ACACACAAGGAAG CT G GAC GG GCT T C GT T GGGGAAGACC 391 

Qy 4 85 TCGTCACCATCCCCAAAGGCTTC-AATACTTCTTTTCTTGTCAACATTGCCACTATTTTT 543 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 392 TCGTCACCATCCCCAAAGGCTTCAAATACTTCTTTTCTTGTCAACATTGCCACTATTTTT 451 

Qy 544 GAATCAGA-GAATTTCTTTTTGCCTGGGATTAAATGGAATGGAATACTTGGCCTAGCTTA 602 

I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 452 GAATCAGAGGAATTTCTTTTTGCCTGGGATTAAATGGAATGGAATACTTGGCCTAGCTTA 511 

Qy 603 TGCCACACTTGCCAAGCCATCAAGTTCTCTGGAGACCTTCTTCGACTCCCTGGTG AC 659 

I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I II I I M I M I I I I I I I II 
Db 512 T GC CACACT T G CCAAGC C AT CAAGTT CT CT G GAGAC CT T CT T CGACT C C CT GGT GAACAC 571 

Qy 660 ACAAGCAAAC AT CC C CAACGT T T T CT C CAT G C AGAT GT GT GGAGC C - GGCTTGCCCGTTG 718 

I II III I I I I I I I I I II I I I I I I I I I I I I I I I I M I II I I I I I I I I I I I 

Db 572 AAGCAAAACATCCCCAAACGTTTTCTCCATGCAGATGTGTGGAGCCGGGCTTGCCCGTTG 631 

Qy 719 CTGG AT CTGGGAC CAAC GGAGGT AGT CT T GT CT T GGGTGGAAT T GAAC CAAGTTT 773 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I II I I I I I I I I I I I 

Db 632 GCT GGGATTCTGGGGAACCAACGGAGGT AGT CTTGTCTTGGGTGGAATT GAAC CAAGTTT 691 

Qy 774 GT ATAAAGGAGACAT CT GGT ATACCCCT ATTAAGGAAGAGTGGTACTACCAGATAGAAAT 833 

I I I I I I I I I I II I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 692 GT ATAAAGGAGACAT CT GGT AT ACC CCT ATTAAGGAAGAGTGGTACT ACCAGAT AGAAAT 751 

Qy 834 TCTGAAATT GGAAATTGGAGGCCAAAGCCTTAAT CT GGACT GCAGAGAGTA 884 

III III I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 752 TCTTGAAATTGGGAAATTGGGAGGCCAAAGCTTTAATTCTTGGGACTGCAGGAGGAGTAT 811 

Qy 885 TAACGCAGACAAGG — CCATCGTGGACAGT-GGCACCACGCTGCTGCGCCT — GCCCCAG 939 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 812 TAACGCAGACAAGGGCCATCGTTGGACAGTGGGCACCACGCTGCTGCGCCTTGCCCCCAG 871 

Qy 940 AAGGTGTTTGATGCGGTGGT-GGAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTC 998 

I I I I I I I I I II I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 

Db 872 AAGGTGTTTGATGCGGTGGTGGGAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTC 931 

Qy 999 TGATGGTTTCTGGACTGGGTCCCAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTC 1058 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 932 TGATGGTTTCTGGACTGGGTCCCAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTC 991 

Qy 1059 T T ACT T C C CT AAAAT CT C CAT CT AC CT GAGAGAT GAGAACT C CAGC AGGT CAT T C C GTAT 1118 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 992 TT ACTT CC CTAAAAT CT C CAT CT AC CT GAGAGAC GAGAACT C CAGC AG GT CAT T C C GTAT 1051 

Qy 1119 C ACAAT CCT GC CT CAGCT T T ACAT T C AGCCCAT GAT G GG GGC CGGC CT GAATT AT GAATG 117 8 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1052 CACAATCCTGCCTCAGCTTTACATTCAGCCCATGATGGGGGCCGGCCTGAATTATGAATG 1111 

Qy 1179 T T AC C GAT T C G GCAT T T CC C CAT C C ACAAAT GC GCT G GT GAT CGGT GC C AC GGT GAT GGA 1238 



I I I I M I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1112 TT AC C GAT T C GGC AT T T C C C CAT C C ACAAAT GC GC T GGTGAT CG GT G C CAC GGT GAT GGA 1171 

Qy 1239 GGGCTTCTACGTCATCTTCGACAGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTG 12 98 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

Db 1172 GGGCTTCTACGTCATCTTCGACAGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTG 1231 

Qy 1299 TGCAGAAATTGCA-GGTGCTGC-AGTGTCTGAAATTTCCGGGCCTTTCTC-AACAGAGGA 1355 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I 
Db 1232 TGCAGAAATTGCACGGTGCTGCAAGTGTCTGAAATTTCCGGGCCTTTCTCAAACAGAGGA 12 91 

Qy 1356 TGTAGCCAG-CAACTGTGTCCCCGCTC-AGTCTTTGAGCGA-GCCCATTTTGTGGATTGT 1412 

I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1292 TGTAGCCAGCCAACTGTGTCCCCGCTCAAGTCTTTGAGCGACGCCCATTTTGTGGATTGT 1351 

Qy 1413 GTCC TATGCGCTCATGAGCGTCTGTGG-AGCCATCCTCCTTGTC-TTAATCGTCCT 1466 

I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1352 GTCCCTATGCCGCTCAATGAAGCGTCTGTGGAAGCCATCCTCCTTGTCGTTAATTCAGTC 1411 

Qy 1467 GCTGCTGC TGCCGTTCCGGTGTCAGCGTCGCCCCCGTGACCCTGAGGTCGTCAATG 1522 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

Db 1412 GCTGCTGCTGCTTGCCGTTCCGGTGTCAGCGTCGCCCCCGTGACCCTGAGGTCGTCAATG 1471 

Qy 1523 AT GAGT C CT CT CT ~ GGT CAGAC AT C GCT GGAAAT GAATAGC C AG GC CT GAC CT CAAGCAA 1581 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 1472 AT GAGT CCTCTCTGGGTCAGACATC GCT GGAAAT GAATAGC CAGGCCT GAC CT CAAGCAA 1531 

Qy 1582 C CAT GAACT CAGCT AT TAAGAAAAT CAC AT T T C CAGGGCAGCAG C C GG GAT CGAT GGT GG 1641 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 

Db 1532 C CAT GAACT CAGCT AT TAAGAAAAT CAC ATTT C CAGGGCAGCAGC C GGGAT C GAT GGT GG 1591 

Qy 1642 CGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCTGCTCCCAGATGCCTTCTAGAT 1701 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 1592 CGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCTGCTCCCAGATGCCTTCTAGAT 1651 

Qy 1702 TCACTGTCTTTTGATTCTTGATTTTCAAGC-TTTCAAATCCTCCCTACTTCCAAGAAAAA 1760 

I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1652 TCACTGTCTTTTGATTCTTGATTTTCT^AGCTTTTCTW^TCCTCCCTACTTCCAAGAATWV 1711 

Qy 1761 T AAT T AAAAAAAAAAC TT CAT T CT AAACC AAAAAAAA 1797 

I I I II I I I I I I I I I I I I II I II I I I I I I I I I I I I I 

Db 1712 TAAT T AAAAAAAAAACTT CAT T CT AAACCAAAACAGA 1748 



RESULT 11 
US-09-280-116-85 

Sequence 85, Application US/09280116A 
Patent No. 6331427 
GENERAL INFORMATION: 
APPLICANT: Robison, Keith E. 

TITLE OF INVENTION: Nucleic Acid Molecules Encoding Human Protease Homologs 
FILE REFERENCE: 5800-24, 035800/17 6965 
CURRENT APPLICATION NUMBER: US/ 09/280 , 11 6A 
CURRENT FILING DATE: 1999-03-26 
NUMBER OF SEQ ID NOS : 2 68 
SOFTWARE: Patentln Ver. 2.0 
SEQ ID NO 85 



sapiens 



LENGTH: 1021 
TYPE : DNA 
ORGANISM: Homo 
FEATURE : 

OTHER INFORMATION: aspartyl proteases 
FEATURE : 

NAME/ KEY : misc_f eature 
LOCATION: (1) . . (1021) 
OTHER INFORMATION: n = a, 
US-09-280-116-85 



t, c or g 



Query Match 52.9%; Score 953.6; DB 4 

Best Local Similarity 98.8%; Pred. No. 3.7e-217 
Matches 971; Conservative 0; Mismatches 10 



Length 1021; 



Indels 



2; Gaps 



1; 



Qy 



Db 



98 TCCGGGTGGCCGCGGCCACGAACCGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTG 157 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

38 TCCGGGTGGCCGCGGCCACGAACCGCGTAGTTGCGCCCACCCCGGGACCCGGGAGCCCTG 97 



QY 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



158 



98 



218 



158 



278 



218 



338 



278 



398 



338 



458 



398 



518 



458 



578 



518 



638 



578 



698 



CCGAGCGCCACGCCGACGGCTTGGCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGG 217 

I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I M I I I I I I I I I I 

CCGAGCGCCACGCCGACGGCTNGGCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGG 157 

GCGCCGCCAACTTCTTGGCCATGGTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACT 277 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GCGCCGCCAACTTCTTGGCCATGGTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACT 217 

AC CT GGAGAT GC T GAT C GGGAC C C C C C C GCAGAAGCT ACAGATTCT C GTTGAC ACT GGAA 337 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

AC CT GGAGAT GCT GAT C GGGAC C C C C C C GCAGAAGCT ACAGATTCTCGTT GAC ACT GGAA 277 



GCAGT AAC TT T G C C GT GGCAGGAAC C C C GCACT C CT ACATAGACACGTACTT T GACACAG 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GC AGTAAC TT T G C C GT GGCAGGAAC C C C GCACT C CT ACAT AGACACGT ACT T T GACACAG 



397 



337 



457 



AGAGGT CT AGCACAT AC C GCT C CAAG GGCT TT GAC GT CACAGTGAAGTACACACAAGGAA 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

AGAGGT CT AGCACAT AC C GCT C CAAGGGCT TT GACGTCACAGT GAAGTACACACAAGGAA 397 

GCTGGACGGGCTTCGTTGGGGAAGACCTCGTCACCATCCCCAAAGGCTTCAATACTTCTT 517 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

GCTGGACGGGCTTCGTTGGGGAAGACCTCGTCACCATCCCCAAAGGCTTCAATACTTCTT 457 

TTCTTGTCAACATTGCCACTATTTTTGAATCAGAGAATTTCTTTTTGCCTGGGATT7\7\AT 577 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

T T CT T GT C AACAT T GC C ACT AT T T T T GAAT C AGAGAAT TTCTTTTTGCCT GGGAT T AAAT 517 

GGAATGGAATACTTGGCCTAGCTTATGCCACACTTGCCAAGCCATCAAGTTCTCTGGAGA 637 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GGAATGGAATACTTGGCCTAGCTTATGCCACACTTGCCAAGCCATCAAGTTCTCTGGAGA 577 

CCTTCTTCGACTCCCTGGTGACAC7^AGC7\AACATCCCCAACGTTTTCTCCATGCAGATGT 697 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

CCTTCTTCGACTCCCTGGTGACACAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGT 637 

GTGGAGCCGGCTTGCCCGTTGCTGGATCTGGGACCAACGGAGGTAGTCTTGTCTTGGGTG 757 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 



Db 



638 GTGGAGCCGGCTTGCCCGTTGCTGGATCTGGGACCAACGGAGGTAGTCTTGTCTTGGGTG 697 



Qy 758 GAAT T GAAC CAAGTT T GT ATAAAG GAGACAT CT GGT AT AC C C CT ATTAAG GAAGAGT GGT 817 

I I I I I I I I I M I I I I II I I I I I I I I I I I II I I I I I I I I U I I I I I I I I I I I I I I I I I I I I 

Db 698 GAAT T GAAC CAAGT TT GT ATAAAGGAGACAT CTGGT AT AC C C CT AT TAAGGAAGAGT GGT 757 

Qy 818 ACT AC C AGAT AGAAAT T C T GAAAT T G GAAATT GGAGGC CAAAGC CT T AAT CT GGACT G CA 877 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I 

Db 758 ACT AC CAGAT AGAAAT T CT GAAAT T GGAAATT GGAGGC CAAAGC CT T AAT CT GGACT G CA 817 

Qy 878 GAGAGTATAACGCAGACAAGGCCATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCC 937 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 818 GAGAGT ATAAC G C AGACAAGGC CAT C GT G GACAGT GGCAC C AC GCT GCT G CGCCTGCCCC 877 

Qy 938 AG AAG GT GT T T GAT G C — GGTGGTGGAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATT 995 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 878 AGAAGGTGTTTGATGCCGGTGGTGGAAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATT 937 

Qy 996 CTCTGATGGTTTCTGGACTGGGTCCCAGCTGGCGTGCTGGACGAATTCGGAAACACCTTG 1055 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 938 CTCTGATGGTTTCTGGACTGGGTCCCACTTGGCGTGCTGGACGAATTCGGAAACACCTTG 997 

Qy 1056 GTCTTACTTCCCTAAAATCTCCA 1078 

I I I I I I I I I I I I I I I I I I I I II 
Db 998 GTCTTACTTCCCTAAAATCTTCA 1020 



RESULT 12 
US-09-724-566A-42 

; Sequence 42, Application US/09724566A 
; Patent No. 6627739 
; GENERAL INFORMATION: 



APPLICANT: 


: Anderson, John P. 


APPLICANT: 


: Basi, Guriqbal 


APPLICANT: 


: Doane, Minn Tarn 


APPLICANT: 


: Frigon, No. 6627739mand 


APPLICANT: 


: John, Varghese 


APPLICANT: 


: Power, Michael 


APPLICANT: 


: Sinha, Sukanto 


APPLICANT: 


: Tatsuno, Gwen 


APPLICANT: 


: Tung, Jay 


APPLICANT: 


: Wang, Shuwen 


APPLICANT: 


: McConlogue, Lisa 



TITLE OF INVENTION: Beta-Secretase Enzyme Compositions and 

; TITLE OF INVENTION: Methods 

FILE REFERENCE: 228-US-NEWC2 

; CURRENT APPLICATION NUMBER: US/ 09/724 , 566A 

; CURRENT FILING DATE: 2000-11-28 

; PRIOR APPLICATION NUMBER: US 09/501,708 

; PRIOR FILING DATE: 2000-02-10 

; PRIOR APPLICATION NUMBER: 60/119,571 

; PRIOR FILING DATE: 1999-02-10 

; PRIOR APPLICATION NUMBER: 60/139,172 

; PRIOR FILING DATE: 1999-06-15 

; NUMBER OF SEQ ID NOS : 104 

; SOFTWARE: FastSEQ for Windows Version 4.0 

; SEQ ID NO 42 



LENGTH: 234 8 
; TYPE: DNA 
; ORGANISM: Homo sapiens 
US-09-724-566A-42 

Query Match 22.0%; Score 397.4; DB 4; Length 2348; 

Best Local Similarity 55.0%; Pred. No. 7.1e-85; 

Matches 863; Conservative 0; Mismatches 676; Indels 30; Gaps 3; 

Qy 2 TGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCCG 61 

I II I I I I I I I I I I I III III I I I I I I I I II I II 

Db 238 TGGGGGCAGGCGCCAGGGACGGACGTGGGCCAGTGCGAGCCCAGAGGGCCCGAAGGCCGG 297 

Qy 62 CCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAACC 121 

II I I II I I II I I MM II I I I I I I I I I I I I 

Db 298 GGCCCACCATGGCCCAAGCCCTGCCCTGGCTCCTGCTGTGGATGGGCGCGGGAGTGCTGC 357 

Qy 122 GCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTGG 181 

I I II III III II III I I I I 

Db 358 CTGCCCACGGCACCCAGCACGGCATCCGGCTGCCCCTGCGCAGCGGCCTGGGGGGCGCCC 417 

Qy 182 CGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGC 224 

I I I I III II I II I I I I I II I III 

Db 418 CCCTGGGGCTGCGGCTGCCCCGGGAGACCGACGAAGAGCCCGAGGAGCCCGGCCGGAGGG 477 

Qy 225 -CAACTTCTTGGCCATGGTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGG 2 83 

I I I I I III I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I 

Db 478 GCAGCTTTGTGGAGATGGTGGACAACCTGAGGGGCAAGTCGGGGCAGGGCTACTACGTGG 537 

Qy 284 AGAT GCT GAT C GGGAC C C C C C C GCAGAAG CTAC AGAT T CT CGT T GAC ACT GGAAGCAGT A 34 3 

I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I 

Db 538 AGAT GAC C GT GGG C AGC C C C C C G CAGAC GCT CAAC AT C CT GGT GGAT AC AGG C AGCAGT A 597 

Qy 344 ACT T T GC C GT GGC AGGAAC C C C GCACT C CT ACAT AGAC AC GT ACT T T GAC AC AGAGAGGT 4 03 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II II 

Db 598 ACTTTGCAGTGGGTGCTGCCCCCCACCCCTTCCTGCATCGCTACTACCAGAGGCAGCTGT 657 

Qy 404 CTAGCACATACCGCT C CAAGGGCTTTGACGT CACAGT GAAGTACACACAAGGAAGCTGGA 4 63 

I I I I I I I I I I I I I I I II III I I I I I I I I I I III 

Db 658 CCAGCACATACCGGGACCTCCGGAAGGGTGTGTATGTGCCCTACACCCAGGGCAAGTGGG 717 

Qy 464 CGGGCTTCGTTGGGGAAGACCTCGTCACCATCCCCAAAGGCTTCAATACTTCTTTTCTTG 523 

II III I I I II II I I II I I I I I I I I III I I I I I I 

Db 718 AAGGGGAGCTGGGCACCGACCTGGTAAGCATCCCCCATGGCCCCAACGTCACTGTGCGTG 777 

Qy 524 T CAACAT T GCC ACT AT T TT T GAAT CAGAGAAT TTCTTTTT GCCT GGGATTAAAT GGAAT G 583 

I I I I I I I I I III I I I I II I I I I I I I I I I I II I I I I I I I 

Db 778 C CAACAT T GCT GC CAT C ACT GAAT CAGAC AAGT T CT T CAT CAACGGCT C CAACT GGGAAG 8 37 

Qy 584 GAATACTTGGCCTAGCTTATGCCACACTTGCCAAGCCATCAAGTTCTCTGGAGACCTTCT 643 

I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II 

Db 838 GCATCCTGGGGCTGGCCTATGCTGAGATTGCCAGGCCTGACGACTCCCTGGAGCCTTTCT 8 97 

Qy 644 T C GACT C C CT GGT GACACAAGCAAAC AT C C C CAAC GT T TT CT C CAT G CAGAT GT GT GGAG 703 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I M I I I I I I I 

Db 8 98 TTGACTCTCTGGTAAAGCAGACCCACGTTCCCAACCTCTTCTCCCTGCAGCTTTGTGGTG 957 



Qy 704 CCGGCTTGCCCGT T GCT GGAT CT GGGACCAACGGAGGTAGT CTTGT CTT GG 754 

I I I I I I I I I I II I I I MINIM | I I I I 

Db 958 CTGGCTTCCCCCTCAACCAGTCTGAAGTGCTGGCCTCTGTCGGAGGGAGCATGATCATTG 1017 

Qy 755 GTGGAAT T GAAC CAAGT T T GT ATAAAGGAGAC AT CT GGT ATACC C CT AT T AAG GAAGAGT 814 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1018 GAGGT AT C GAC CACT C GCT GT ACACAGGC AGT CT CT GGTAT ACAC C CAT C C G GCGGGAGT 1077 

Qy 815 GGTACTACCAGATAGAAATTCT GAAATT GGAAATTGGAGGCCAAAGC CTTAAT CT GGACT 874 

I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1078 GGTAT TAT GAGGT GAT C ATT GT G C GGGT GGAGATCAAT GGAC AGGAT CT GAAAAT GGACT 1137 

Qy 875 GCAGAGAGT ATAACGCAGACAAGGCCAT CGT GGACAGTGGCACCACGCT GCT GCGCCT GC 934 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I III 

Db 1138 GCAAGGAGT ACAACTAT GACAAGAGCATT GT GGACAGTGGCAC CACCAACCTTCGTTT GC 1197 

Qy 935 CCCAGAAGGTGTTTGATGCGGTGGTGGAAGCTGTGGCCCGCGCATCTCTGATTCCAGAAT 994 

I I I I I I I I I I I I I I I I I II III I I I I I I II 

Db 1198 CCAAGAAAGT GT T T GAAGCT G C AGT CAAAT C CAT CAAGGC AGC CT C CT C C AC GGAGAAGT 1257 

Qy 995 TCTCTGATGGTTTCTGGACTGGGTCCCAGCTGGCGTGCTGGACGAATTCGGAAACACCTT 1054 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I II 

Db 1258 TCCCTGATGGTTTCTGGCTAGGAGAGCAGCTGGTGTGCTGGCAAGCAGGCACCACCCCTT 1317 

Qy 1055 GGT CT T ACT T C C CT AAAAT CT C CAT C T AC CT GAGAGAT GAGAACT C CAGC AGGT CAT T C C 1114 

II I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I 

Db 1318 GGAAC AT T T T C C CAGT C AT CT C ACT CT AC CTAAT GGGT GAGGT TAC CAAC CAGT C CT T C C 1377 

Qy 1115 GT AT CACAAT C CT GC CT C AGC T T TAC AT T C AGCCCAT GAT GGGGGCCGGC CT G AATT 1171 

I I I I I I I I I II I I I I I I I I I I I I I I II I I II I I 

Db 1378 GC AT C AC CAT C CT T C C GCAGCAAT AC CT GC GGCCAGT GGAAGAT GT GG C C AC GT C C CAAG 1437 

Qy 1172 AT GAAT GTT AC C GAT T C GGC ATT T C C C CAT C CACAAAT G C GCT GGT GAT C GGT G C C AC GG 1231 

I I I I I I I I I I I I I I I I I I II II I II I I I I I I 

Db 1438 ACGACT GT T ACAAGT T T G C CAT CT CAC AGT CAT CCAC GG GCACT GT TAT G GGAG CT GT T A 14 97 

Qy 1232 T GAT GGAGG GCT T CT AC GT CAT C T T C GACAGAGC CC AGAAGAGG GT GGGCT T C GC AGC GA 12 91 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 1498 TCATGGAGGGCTTCTACGTTGTCTTTGATCGGGCCCGAAAACGAATTGGCTTTGCTGTCA 1557 

Qy 1292 GCCCCTGTGCAGAAATTGCAGGTGCTGCAGTGTCTGAAATTTCCGGGCCTTTCTCAACAG 1351 

II I I I I II III I I I I I I I I II 

Db 1558 GCGCTTGCCATGTGCACGATGAGTTCAGGACGGCAGCGGTGGAAGGCCCTTTTGTCACCT 1617 

Qy 1352 AGGATGTAGCCAGCAACTGTGTCCCCGCTCAGTCTTTGAGCGAGCCCATTTTGTGGATTG 1411 

I I I I I I I I I I I I II I I I II 

Db 1618 T GGAC AT GGAAGACT GT GGCT ACAACAT T CCACAGACAGAT GAGT CAAC C CT CAT GAC C A 1677 

Qy 1412 TGTCCTATGCGCTCATGAGCGTCTGTGGAGCCATCCTCCTTGTCTTAATCGTCCTGCTGC 1471 

I I I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 1678 TAGCCTATGTCATGGCTGCCATCTGCGCCCTCTTCATGCTGCCACTCTGCCTCATGGTGT 1737 

Qy 1472 T GCT GCCGTTCCGGTGTCAGCGTCGCCCCCGTGACCCT GAGGT CGT CAATGATGAGTCCT 1531 

II I II I II III I I I I I I I I I I I I I I II 

Db 1738 GT CAGT GGC GCT GCCTCCGCTGCCTGCGCCAGCAGCAT GAT GACTTT GCT GAT GACATCT 1797 

Qy 1532 CTCTGGTCA 1540 



Db 17 98 CCCTGCTGA 1806 



RESULT 13 
US-09-724-566A-44 

Sequence 44, Application US/09724566A 
Patent Mo. 6627739 
GENERAL INFORMATION: 



APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 



Anderson, John P. 
Basi, Guriqbal 
Doane, Minh Tarn 
Frigon, No. 6627739mand 
John, Varghese 
Power, Michael 
Sinha, Sukanto 
Tatsuno, Gwen 
Tung, Jay 
Wang, Shuwen 
McConlogue, Lisa 
TITLE OF INVENTION: Beta-Secretase Enzyme Compositions and 
TITLE OF INVENTION: Methods 
FILE REFERENCE: 22 8-US-NEWC2 

CURRENT APPLICATION NUMBER: US/ 09/724 , 566A 
CURRENT FILING DATE: 2000-11-28 
PRIOR APPLICATION NUMBER: US 09/501,708 
PRIOR FILING DATE: 2000-02-10 
PRIOR APPLICATION NUMBER: 60/119,571 
PRIOR FILING DATE: 1999-02-10 
PRIOR APPLICATION NUMBER: 60/139,172 
PRIOR FILING DATE: 1999-06-15 
NUMBER OF SEQ ID NOS : 104 

SOFTWARE: FastSEQ for Windows Version 4.0 
SEQ ID NO 44 
LENGTH: 2348 
TYPE: DNA 

ORGANISM: Homo sapiens 
US-09-724-566A-44 

Query Match 22.0%; Score 397.4; DB 4; Length 2348; 

Best Local Similarity 55.0%; Pred. No. 7.1e-85; 

Matches 8 63; Conservative 0; Mismatches 67 6; Indels 30; Gaps 3; 

Qy 2 TGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCCG 61 

I I I I I I I I I I I I I I III III I I I I I I I I II I II 

Db 238 TGGGGGCAGGCGCCAGGGACGGACGTGGGCCAGTGCGAGCCCAGAGGGCCCGAAGGCCGG 297 

Qy 62 CCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAACC 121 

II I I I I I I III I I I I I II I I I I I I I I I I I I 

Db 298 GGCCCACCATGGCCCAAGCCCTGCCCTGGCTCCTGCTGTGGATGGGCGCGGGAGTGCTGC 357 

Qy 122 GCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTGG 181 

I I II III III II III I I I I 

Db 358 CTGCCCACGGCACCCAGCACGGCATCCGGCTGCCCCTGCGCAGCGGCCTGGGGGGCGCCC 417 

Qy 182 CGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGC 224 

I I I I III II I I I I I I I I II I III 



Db 



418 CCCTGGGGCTGCGGCTGCCCCGGGAGACCGACGAAGAGCCCGAGGAGCCCGGCCGGAGGG 477 



Qy 225 -CAACTTCTTGGCCATGGTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGG 283 

I I I I I III I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I 

Db 478 GCAGCTTTGTGGAGATGGTGGACAACCTGAGGGGCAAGTCGGGGCAGGGCTACTACGTGG 537 

Qy 284 AGATGCTGATCGGGACCCCCC CGCAGAAGCTACAGATT CT C GTT GACACT GGAAGCAGT A 343 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 538 AGAT GACC GT GGGC AGCCC C C C GC AGAC GCT CAAC AT C CT G GT GGAT AC AGGCAGCAGT A 597 

Qy 344 ACT T T GCC GT GG CAGGAAC C C C G C ACT C CT AC AT AGAC AC GT ACT TT GACAC AGAGAG GT 4 03 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I II II II 

Db 598 ACTTTGCAGTGGGTGCTGCCCCCCACCCCTTCCTGCATCGCTACTACCAGAGGCAGCTGT 657 

Qy 4 04 CTAGCACATACCGCTCCAAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGA 4 63 

I I I I I I I I I I I I I I I II Ml I I I I I I I II I III 

Db 658 CCAGCACATACCGGGACCTCCGGAAGGGTGTGTATGTGCCCTACACCCAGGGCAAGTGGG 717 

Qy 4 64 CGGGCTTCGTTGGGGAAGACCTCGTCACCATCCCCAAAGGCTTCAATACTTCTTTTCTTG 523 

II III I I I I I I I I I I I I I I I I I I I III I I I I I I 

Db 718 AAGGGGAGCTGGGCACCGACCTGGTAAGCATCCCCCATGGCCCCAACGTCACTGTGCGTG 777 

Qy 524 TCAACATTGCCACTATTTTTGAATCAGAGAATTTCTTTTTGCCTGGGATTAAATGGAATG 583 

I I I I I I I I I III I I I I I I I I I I I I I I I I I II II I I I I I 

Db 778 C CAACATT GCT GC CAT C ACT GAAT CAGACAAGT T CTT C AT C AAC GGCT CCAACT GGGAAG 837 

Qy 584 GAATACTTGGCCTAGCTTATGCCACACTTGCCAAGCCATCAAGTTCTCTGGAGACCTTCT 643 

I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I Mil 

Db 838 GCATCCTGGGGCTGGCCTATGCTGAGATTGCCAGGCCTGACGACTCCCTGGAGCCTTTCT 8 97 

Qy 644 T C GACT CC CT GGT GAC ACAAG CAAACAT C CC CAAC GTTT T CT C CAT GCAGAT GT GTGGAG 7 03 

I I I I I I I I I II I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

Db 898 TTGACTCTCTGGTAAAGCAGACCCACGTTCCCAACCTCTTCTCCCTGCAGCTTTGTGGTG 957 

Qy 704 CCGGCTTGCCCGT T GCTGGAT CT GGGACCAACGGAGGTAGT CTT GT CTT GG 754 

I I I I I I I I I I II I I I I M I I I I I I I I I I 

Db 958 CTGGCTTCCCCCTCAACCAGTCTGAAGTGCTGGCCTCTGTCGGAGGGAGCATGATCATTG 1017 

Qy 755 GT GGAATTGAACCAAGTTTGT ATAAAGGAGACAT CT GGTAT ACCCCT ATTAAGGAAGAGT 814 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 1018 G AGGTAT CGAC CAC T C GCT GT AC ACAGG CAGT CT CT GGT AT ACAC CC AT CC GGC GGGAGT 1077 

Qy 815 GGT ACT ACC AGAT AGAAAT T CT GAAATT GGAAAT T GGAGGC CAAAG CCT TAAT CT GGACT 874 

I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1078 GGTAT TAT GAGGT GAT CAT T GT GC GGGT GGAGAT CAAT GGAC AGGATCT GAAAAT GGACT 1137 

Qy 875 GC AGAGAGT AT AAC GC AGACAAG G C CAT C GT GGAC AGT GG CAC CAC GCT GCT GCGCCTGC 934 

III I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

Db 1138 GCAAGGAGT ACAACT AT GACAAGAGC AT T GT GGAC AGT GGC AC CAC CAAC CT T C GTTT G C 1197 

Qy 935 C C C AGAAGGT GTTT GAT GC GGT GGT G GAAG CT GT GGCCCGCG C AT CT CT GAT T C CAGAAT 994 

I I I I I I I I I I I I I I I I I II III I I I I I I II 

Db 1198 C CAAGAAAGT GTT T GAAGCT GC AGT CAAAT C CAT CAAGGC AG C CT C CT C CAC GGAGAAGT 1257 

Qy 995 TCTCTGATGGTTTCTGGACTGGGTCCCAGCTGGCGTGCTGGACGAATTCGGAAACACCTT 1054 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

Db 1258 TCCCTGATGGTTTCTGGCTAGGAGAGCAGCTGGTGTGCTGGCAAGCAGGCACCACCCCTT 1317 



Qy 1055 GGTCTTACTTCCCTAAAATCTCCATCTACCTGAGAGATGAGAACTCCAGCAGGTCATTCC 1114 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1318 G GAAC AT T T T C C CAGT CAT CT C ACT CT AC CT AAT GGGT GAGGT T ACCAAC CAGT C CT T C C 1377 

Qy 1115 GT AT CACAAT CCT GCCT C AG CT T TAC AT T CAGC C CAT GAT GGGGGCC G GC C T G AATT 1171 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I 

Db 137 8 GCAT CAC CAT C CTT CC GC AGCAAT AC CT GCGG C CAGT GGAAGAT GT GGC CAC GT C C CAAG 1437 

Qy 1172 AT GAAT GT TAC C GAT T C GGC AT T T C C C CAT C C ACAAAT GC G CT GGT GAT C GGT GC C AC GG 1231 

I I I I I I I I I I I I I I I I I I II II I I I I I I I I I 

Db 1438 ACGACTGTTACAAGTTTGCCATCTCACAGTCATCCACGGGCACTGTTATGGGAGCTGTTA 14 97 

Qy 1232 T GAT GGAGGGCTT CT AC GT CAT CT T C GACAGAGC C C AGAAGAGGGT GGG CT T C GC AGC GA 1291 

I I I I I I II I I I I I I I I I I I 1 I I I I I I I I I II I I I I I I I I I I I 

Db 1498 TCATGGAGGGCTTCTACGTTGTCTTTGATCGGGCCCGAAAACGAATTGGCTTTGCTGTCA 1557 

Qy 1292 GCCCCTGTGCAGAAATTGCAGGTGCTGCAGTGTCTGAAATTTCCGGGCCTTTCTCAACAG 1351 

I I I I I I II III I I I I I I I I II 

Db . 1558 GCGCTTGC CAT GT GC AC GAT GAGT T C AGGAC GG C AG C GGT G GAAGG C C CT T T T GT CAC CT 1617 

Qy 1352 AGGATGTAGCCAGCAACTGTGTCCCCGCTCAGTCTTTGAGCGAGCCCATTTTGTGGATTG 1411 

I I I I I I I I I I I I I I I I I II 

Db 1618 T GGAC AT GGAAGACT GT G G CT ACAAC ATTC C AC AGACAGAT GAGT CAAC CCT CAT GAC CA 1677 

Qy 1412 TGTCCTATGCGCTCATGAGCGTCTGTGGAGCCATCCTCCTTGTCTTAATCGTCCTGCTGC 1471 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1678 TAGCCTATGTCATGGCTGCCATCTGCGCCCTCTTCATGCTGCCACTCTGCCTCATGGTGT 1737 

Qy 1472 TGCTGCCGTTCCGGTGTCAGCGTCGCCCCCGTGACCCTGAGGTCGTCAATGATGAGTCCT 1531 

II I II I II III I I I I I I I I I I I I I I II 

Db 1738 GTCAGTGGCGCTGCCTCCGCT GCCT GCGCCAGCAGCAT GAT GACTTTGCTGATGACATCT 1797 

Qy 1532 CTCTGGTCA 1540 

I II I I I 
Db 1798 CCCTGCTGA 1806 

RESULT 14 
US-09-724-566A-48 

; Sequence 48, Application US/09724566A 
; Patent No. 6627739 
; GENERAL INFORMATION: 



APPLICANT: 


: Anderson, John P. 


APPLICANT: 


: Basi, Guriqbal 


APPLICANT: 


: Doane, Minn Tarn 


APPLICANT: 


: Frigon, No. 66277 39mand 


APPLICANT: 


: John, Varghese 


APPLICANT: 


: Power, Michael 


APPLICANT: 


: Sinha, Sukanto 


APPLICANT: 


: Tatsuno, Gwen 


APPLICANT: 


: Tung, Jay 


APPLICANT: 


: Wang, Shuwen 


APPLICANT: 


: McConlogue, Lisa 



; TITLE OF INVENTION: Beta-Secretase Enzyme Compositions and 
TITLE OF INVENTION: Methods 
FILE REFERENCE: 228-US-NEWC2 



CURRENT APPLICATION NUMBER: US/09/724, 566A 
CURRENT FILING DATE: 2000-11-28 
PRIOR APPLICATION NUMBER: US 09/501,708 
PRIOR FILING DATE: 2000-02-10 
PRIOR APPLICATION NUMBER: 60/119,571 
PRIOR FILING DATE: 1999-02-10 
PRIOR APPLICATION NUMBER: 60/139,172 
PRIOR FILING DATE: 1999-06-15 
NUMBER OF SEQ ID NOS : 104 

SOFTWARE: FastSEQ for Windows Version 4.0 
SEQ ID NO 48 
LENGTH: 16080 
TYPE: DNA 

ORGANISM: Artificial Sequence 
FEATURE : 

OTHER INFORMATION: Expression Vector pCEK 
FEATURE: 

NAME/ KEY: misc_feature 
LOCATION: (1) . . . (16080) 
OTHER INFORMATION: n = A,T,C or G 
US-09-724-566A-48 

Query Match 22.0%; Score 397.4; DB 4; Length 16080; 

Best Local Similarity 55.0%; Pred. No. 1.5e-84; 

Matches 863; Conservative 0; Mismatches 67 6; Indels 30; Gaps 3; 

Qy 2 TGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCCG 61 

I I I I I I I I I I I I I I III III I I I I I I I I II I II 

Db 1607 TGGGGGCAGGCGCCAGGGACGGACGTGGGCCAGTGCGAGCCCAGAGGGCCCGAAGGCCGG 1666 

Qy 62 CCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAACC 121 

II I I I I I I M I I I I I I II I I I I I I I I I I I I 

Db 1667 GGCCCACCATGGCCCAAGCCCTGCCCTGGCTCCTGCTGTGGATGGGCGCGGGAGTGCTGC 1726 

Qy 122 GCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTGG 181 

I I II III III II III I III 

Db 1727 CTGCCCACGGCACCCAGCACGGCATCCGGCTGCCCCTGCGCAGCGGCCTGGGGGGCGCCC 1786 

Qy 182 CGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGC 224 

I I I I III II I I I I I I I I II I III 

Db 1787 CCCTGGGGCTGCGGCTGCCCCGGGAGACCGACGAAGAGCCCGAGGAGCCCGGCCGGAGGG 1846 

Qy 22 5 -CAACTTCTTGGCCATGGTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGG 283 

I I I I I III I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I 
Db 1847 GCAGCTTTGTGGAGATGGTGGACAACCTGAGGGGCAAGTCGGGGCAGGGCTACTACGTGG 1906 

Qy 2 84 AGAT G CT GAT C GGGAC C C C C C C GCAGAAGCT AC AGAT T CT C GT T GAC AC T GGAAGCAGT A 343 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1907 AGATGACCGTGGGCAGCCCCCCGCAGACGCTCAACATCCTGGTGGATACAGGCAGCAGTA 1966 

Qy 344 ACT T T GC C GT GGCAGGAAC C C C GCACT CCT ACAT AGAC AC GT ACTT T GAC AC AGAGAG GT 403 

I I I I I I I I I I I I I I I I I I I I I I I I I MM II II II 

Db 1967 ACTTTGCAGTGGGTGCTGCCCCCCACCCCTTCCTGCATCGCTACTACCAGAGGCAGCTGT 2026 

Qy 4 04 CT AGC AC AT AC C G CT C CAAGG G CT TTGAC GT CAC AGT GAAGT ACACACAAGGAAG CT GGA 4 63 

I I I I I I I I I I I I I I I II I II I I I I I I I || I III 

Db 2 027 C C AGC AC AT AC C G G GAC CT C C G GAAGGGTGT GT AT GT GC C CT ACAC C CAG GGCAAGT GG G 2 086 



Qy 4 64 CGGGCTTCGTTGGGGAAGACCTCGTCACCATCCCCAAAGGCTTCAATACTTCTTTTCTTG 52 3 

II III I I I I I I I I I I I I I I I I I I I III I I I I I I 

Db 2087 AAGGGGAGCTGGGCACCGACCTGGTAAGCATCCCCCATGGCCCCAACGTCACTGTGCGTG 2146 

Qy 524 T CAACATT GC C ACT AT T T TT GAAT CAGAGAAT TTCTTTTTGCCT GGGATTAAAT GGAAT G 58 3 

I I I I I I I I I III I I I I I I I II I I I I I I I I II I I I I I I I 

Db 2147 CCAAC ATT G CT GC C AT C ACT GAAT CAGACAAGT T CT T CAT CAAC G GC T CCAACT G GGAAG 22 06 

Qy 584 GAATACTTGGCCTAGCTTATGCCACACTTGCCAAGCCATCAAGTTCTCTGGAGACCTTCT 64 3 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2207 GCATCCTGGGGCTGGCCTATGCTGAGATTGCCAGGCCTGACGACTCCCTGGAGCCTTTCT 2266 

Qy 644 T C GACT CC CT GGT GACACAAG C AAAC AT CC C CAAC GTT T T C T C CAT G C AGAT GT GT G GAG 703 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2267 TTGACTCTCTGGTAAAGCAGACCCACGTTCCCAACCTCTTCTCCCTGCAGCTTTGTGGTG 2326 

Qy 7 04 CCGGCTTGCCCGT TGCTGGATCTGGGACCAACGGAGGTAGTCTTGTCTTGG 754 

I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 2327 CTGGCTTCCCCCTCAACCAGTCTGAAGTGCTGGCCTCTGTCGGAGGGAGCATGATCATTG 2386 

Qy 755 GT GGAATT GAACCAAGTTT GTATAAAGGAGACAT CT GGTATACCCCTATTAAGGAAGAGT 814 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I 

Db 2387 GAGGTATCGACCACTCGCTGTACACAGGCAGTCTCTGGTATACACCCATCCGGCGGGAGT 244 6 

Qy 815 GGT ACT AC C AGAT AGAAAT T CT GAAATT GGAAAT T GGAGGC CAAAG C CTTAAT CT GGACT 874 

I I I I I I III I II I I I I I I I I I I I I I I I I I I I I I I 

Db 2447 GGTATTAT GAGGTCAT CATT GT GCGGGTGGAGAT CAATGGACAGGATCTGAAAATGGACT 2506 

Qy 875 GC AGAGAGT AT AAC GC AGACAAGGCCAT C GT GGAC AGT G GCAC C AC GCT GCT GC GC CT GC 934 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

Db 2507 G CAAGGAGT ACAACT AT GACAAGAGCAT T GT GGACAGT GGCAC C AC CAAC CT T C GT T T GC 2566 

Qy 935 C C CAGAAGGT GT T T GAT GC GGT GGT GGAAGCT GT GG C C C G C GCAT CTCT GAT T C CAGAAT 994 

I I I I I I I I I I I I I I I I I II III I II II | M 

Db 2567 C CAAGAAAGT GT TT GAAGCT GC AGT CAAAT C CAT CAAGG CAGC CTCCTC C AC GGAGAAGT 2626 

Qy 995 TCTCTGATGGTTTCTGGACTGGGTCCCAGCTGGCGTGCTGGACGAATTCGGAAACACCTT 1054 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II 

Db 2627 TCCCTGATGGTTTCTGGCTAGGAGAGCAGCTGGTGTGCTGGCAAGCAGGCACCACCCCTT 2 686 

Qy 1055 GGT CT T AC TT C C CT AAAAT CT C CAT CT ACCT GAGAGAT GAGAAC T CCAGC AGGT CAT T C C 1114 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2687 GGAACATTTTCCCAGTCATCTCACTCTACCTAATGGGTGAGGTTACCAACCAGTCCTTCC 2746 

Qy 1115 GTATCACAATCCTGCCTCAGCTTTACATTCAGCCCATGATGGGGGCCGGCCTG AATT 1171 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I 

Db 2747 GCAT C AC CAT C CT T C C G C AGCAAT ACCT GC G GC C AGT GGAAGAT GT GGC C AC GT C C CAAG 2 8 06 

Qy 1172 AT GAAT GT T AC CGAT T C GGCAT TT C CC C AT C C ACAAAT GC GCT G GT GAT C GGT GC C AC GG 1231 

I I I I I I I I I I I I I I I I I I II II I I I I I I I I I 

Db 2 807 ACGACTGTTACAAGTTTGCCATCTCACAGTCATCCACGGGCACTGTTATGGGAGCTGTTA 2 8 66 

Qy 1232 
Db 2867 



TGATGGAGGGCTTCTACGTCATCTTCGACAGAGCCCAGAAGAGGGTGGGCTTCGCAGCGA 12 91 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
TCATGGAGGGCTTCTACGTTGTCTTTGATCGGGCCCGAAAACGAATTGGCTTTGCTGTCA 2 926 



Qy 1292 GCCCCTGTGCAGAAATTGCAGGTGCTGCAGTGTCTGAAATTTCCGGGCCTTTCTCAACAG 1351 

I I I I I I II III I I I I I I I I M 

Db 2927 GCGCTTGCCATGTGCACGATGAGTTCAGGACGGCAGCGGTGGAAGGCCCTTTTGTCACCT 2986 

Qy 1352 AGGAT GT AGC C AGCAACT GT GT C C C C GCT CAGT CT T T GAG CGAG C CCAT T TT GTGGAT T G 1411 

I I I I I I I I I I I Mill I II 

Db 2987 T GGACAT GGAAGACT GT GGCT ACAACAT T CCACAGACAGAT GAGT CAAC C CT CAT GAC C A 3046 

Qy 1412 TGTCCTATGCGCTCATGAGCGTCTGTGGAGCCATCCTCCTTGTCTTAATCGTCCTGCTGC 1471 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3047 TAGCCTATGTCATGGCTGCCATCTGCGCCCTCTTCATGCTGCCACTCTGCCTCATGGTGT 3106 

Qy 1472 TGCTGCCGTTCCGGTGTCAGCGTCGCCCCCGTGACCCTGAGGTCGTCAATGATGAGTCCT 1531 

II I II I II III I I I I I I I I I I I I I I II 

Db 3107 GTCAGTGGCGCTGCCTCCGCTGCCTGCGCCAGCAGCATGATGACTTTGCTGATGACATCT 3166 

Qy 1532 CTCTGGTCA 1540 

I I I I I I 

Db 3167 CCCTGCTGA 3175 



RESULT 15 
US-09-724-566A-1 

; Sequence 1, Application US/09724566A 
; Patent No. 6627739 
; GENERAL INFORMATION: 



APPLICANT 


: Anderson, John P. 


APPLICANT: 


: Basi, Guriqbal 


APPLICANT: 


: Doane, Minn Tarn 


APPLICANT: 


: Frigon, No. 6627739mand 


APPLICANT: 


: John, Varghese 


APPLICANT: 


: Power, Michael 


APPLICANT; 


: Sinha, Sukanto 


APPLICANT: 


: Tatsuno, Gwen 


APPLICANT: 


Tung, Jay 


APPLICANT: 


Wang, Shuwen 


APPLICANT: 


McConlogue, Lisa 



; TITLE OF INVENTION: Beta-Secretase Enzyme Compositions and 
; TITLE OF INVENTION: Methods 

FILE REFERENCE: 228-US-NEWC2 
; CURRENT APPLICATION NUMBER: US/ 09/724 , 566A 
; CURRENT FILING DATE: 2000-11-28 

PRIOR APPLICATION NUMBER: US 09/501,708 
; PRIOR FILING DATE: 2000-02-10 
; PRIOR APPLICATION NUMBER: 60/119,571 
; PRIOR FILING DATE: 1999-02-10 

PRIOR APPLICATION NUMBER: 60/139,172 
; PRIOR FILING DATE: 1999-06-15 
; NUMBER OF SEQ ID NOS : 104 

SOFTWARE: FastSEQ for Windows Version 4.0 
; SEQ ID NO 1 

LENGTH: 1503 
TYPE: DNA 

ORGANISM: Homo sapiens 
US-09-724-566A-1 



Query Match 



21.9%; Score 395; DB 4; Length 1503; 



Best Local Similarity 55.6%; Pred. No. 2.2e-84; 

Matches 8 05; Conservative 0; Mismatches 630; Indels 12; Gaps 2; 

Qy 106 GCCGCGGCCACGAACCGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGC 165 

III I I I I I I I I I II I I I I I III I I I I I 

Db 55 GCCCACGGCACCCAGCACGGCATCCGGCTGCCCCTGCGCAGCGGCCTGGGGGGCGCCCCC 114 

Qy 166 CACGCCGACGGCTTGGCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCC 225 

II I I I I I I II I I I I I I I I I II 

Db 115 CTGGGGCTGCGGCTGCCCCGGGAGACCGACGAAGAGCCCGAGGAGCCCGGCCGGAGGGGC 174 

Qy 226 AACTTCTTGGCCATGGTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAG 285 

I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I i II 
Db 175 AGCTTTGTGGAGATGGTGGACAACCTGAGGGGCAAGTCGGGGCAGGGCTACTACGTGGAG 234 

Qy 286 AT GCT GAT C GGGAC C C C C CC GCAGAAGCT ACAGAT T CT C GT T GAC ACT GGAAGCAGT AAC 345 

Ml I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 235 AT GAC C GTGGGCAGC C C C C C GCAGAC GCT CAAC AT C CT GGT G GAT ACAGGCAGCAGT AAC 294 

Qy 34 6 T TT GC C GT GGCAGGAAC C C C GCACT C CTAC AT AGACAC GT ACT T T GACACAGAGAGGT CT 4 05 

I I II I I I I I I I I I I I I I I II I I I II I I II II III 

Db 295 TTTGCAGTGGGTGCTGCCCCCCACCCCTTCCTGCATCGCTACTACCAGAGGCAGCTGTCC 354 

Qy 4 06 AGCACAT ACC GCT C CAAGGGCT T T GAC GT CACAGT GAAGT AC AC ACAAGGAAGCT GGAC G 4 65 

I I I I I I I I I I I I I I M III I I I I I I I I I I III 

Db 355 AGCACAT AC C GG GAC CT C C GGAAG GGT GT GT AT GT GC C CT ACAC C C AGGGCAAGT GGGAA 414 

Qy 466 GGCTTCGTTGGGGAAGACCTCGTCACCATCCCCAAAGGCTTCAATACTTCTTTTCTTGTC 525 

II III I I I I I I I I I I II I I I I II I III I I I I I I I 

Db 415 GGGGAGCTGGGCACCGACCTGGTAAGCATCCCCCATGGCCCCAACGTCACTGTGCGTGCC 47 4 

Qy 52 6 AAC ATT GCCACT ATT T T T GAAT C AGAGAATT T CTTTTTGCCT GGGAT TAAAT GGAAT GGA 585 

I I I I I I I I III I I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 4 75 AACATT GCT GC CAT C AC T GAAT C AGACAAGT T CT T CAT CAAC GGCT C CAACT GGGAAG GC 534 

Qy 586 ATACTTGGCCTAGCTTATGCCACACTTGCCAAGCCATCAAGTTCTCTGGAGACCTTCTTC 64 5 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

Db 535 ATCCTGGGGCTGGCCTATGCTGAGATTGCCAGGCCTGACGACTCCCTGGAGCCTTTCTTT 594 

Qy 646 GACT CCCT GGT GACACAAGCAAAC AT CCC CAAC GT T T T C T C CAT GCAGAT GT GT G GAGC C 705 

I I I I I II I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 595 GACTCTCTGGTAAAGCAGACCCACGTTCCCAACCTCTTCTCCCTGCAGCTTTGTGGTGCT 654 

Qy 7 06 GGCTTGCCCGT TGCTGGATCT GGGAC CAAC GGAGGTAGTCTTGTCTTGGGT 756 

I I I I I I I I I II I I I I I II I I I I I II I I I 

Db 655 GGCTTCCCCCTCAACCAGTCTGAAGTGCTGGCCTCTGTCGGAGGGAGCATGATCATTGGA 714 

Qy 757 GGAATTGAACCAAGTTT GTATAAAGGAGACATCT GGTATACC CCTATTAAGGAAGAGT GG 816 

II II 111 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 715 GGT AT CGAC C ACT C GCT GT AC AC AGGCAGT C T CT GGT AT ACACC C ATCCGGC GGGAGT G G 77 4 

Qy 817 T ACTACC AGAT AGAAAT T CT GAAATT GGAAAT T G GAGG C CAAAG C CTTAAT CT GGAC T GC 87 6 

I I I I III I I I I I II I I II II II I I I I MINIM 

Db 775 T ATT AT GAG GT GAT CAT T GT G CG GGT GGAGAT CAAT G GAC AG GAT CT GAAAAT G GACT GC 834 

Qy 877 AGAGAGTATAACGCAGACAAGGCCATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCC 936 

I II II I II I I II I I I I I I I I M I II II I I I II II I II I I II I I I 



Db 835 AAGGAGT ACAAC TAT GACAAGAGCAT T GT GGACAGT GGCAC CAC CAAC CT T CGTTTGCCC 894 

Qy 937 CAGAAGGT GT TT GATGC GGT GGT G GAAGCTGT GGCCCGCG CAT CT CT GAT T C C AGAAT T C 996 

I I I I I I I I I I I I I I I II III I I I I I I I I I I 

Db 895 AAGAAAGT GT T T GAAG CT GC AGT CAAAT CCAT CAAG GCAGC CT C CT C CAC GGAGAAGT TC 954 

Qy 997 TCTGATGGTTTCTGGACTGGGTCCCAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGG 1056 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

Db 955 CCTGATGGTTTCTGGCTAGGAGAGCAGCTGGTGTGCTGGCAAGCAGGCACCACCCCTTGG 1014 

Qy 1057 T CT T ACT T C C CT AAAAT CT C CAT CT AC CT GAGAGAT GAGAACT CC AGC AGGT CAT T C C GT 1116 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I! I I I I I 

Db 1015 AACAT TT T C C C AGT CAT CT CACT CT AC CTAAT GGGT GAGGTT ACCAAC CAGT C CT T C C GC 107 4 

Qy 1117 AT C ACAAT C CT GCCT C AGCT T T ACAT T CAGC C CAT G ATGGGGGCCGGCCTGAATTAT 1173 

I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I 

Db 1075 AT CAC CAT C CTT CCGCAGCAAT AC CT GCGGC C AGT GGAAGAT GT GGC C AC GT C C CAAGAC 1134 

Qy 1174 GAAT GT T AC C GAT T C GGC ATT T C C C C ATC CACAAAT GC G CT GGT GAT C GGT GC CAC GGT G 1233 

I I M I I I I I I I I I I I I I II II I I I I I I I I I I 

Db 1135 GACT GT T ACAAGTT T GC CAT CT C ACAGT CAT C C AC GGGC AC T GT TAT GGGAGCT GT TAT C 1194 

Qy 1234 ATGGAGGGCTTCTACGTCATCTTCGACAGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGC 12 93 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I III 
Db 1195 ATGGAGGGCTTCTACGTTGTCTTTGATCGGGCCCGAAAACGAATTGGCTTTGCTGTCAGC 1254 

Qy 1294 CCCTGTGCAGAAATTGCAGGTGCTGCAGTGTCTGAAATTTCCGGGCCTTTCTCAACAGAG 1353 

I M I • II III I II I I I I I II I 

Db 1255 GCT T GC C AT GTGCAC GAT GAGTT CAGGAC GGC AG C GGT G GAAGGC C CT T T T GT CAC CTT G 1314 

Qy 1354 GAT GT AGC CAGCAACT GT GT C C C C GCT CAGT CT T T GAGC GAGCC C AT T T T GT GGATTGT G 1413 

I I I I I I I I II I I I I I I II I 

Db 1315 GACAT GGAAGACT GTGGCTACAACATTC CACAGACAGAT GAGT CAAC CCT CAT GACCATA 1374 

Qy 1414 TCCTATGCGCTCATGAGCGTCTGTGGAGCCATCCTCCTTGTCTTAATCGTCCTGCTGCTG 1473 

I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 1375 GCCTATGTCATGGCTGCCATCTGCGCCCTCTTCATGCTGCCACTCTGCCTCATGGTGTGT 1434 

Qy 1474 CTGCCGTTCCGGTGTCAGCGTCGCCCCCGTGACCCTGAGGTCGTCAATGATGAGTCCTCT 1533 

II I II I II III I I I I I I I I I I I I I I III 

Db 1435 CAGTGGCGCTGCCTCCGCTGCCTGCGCCAGCAGCATGATGACTTTGCTGATGACATCTCC 14 94 

Qy 1534 CTGGTCA 1540 

I I I I I 

Db 1495 CTGCTGA 1501 

Search completed: February 28, 2004, 07:06:31 
Job time : 163 sees 



GenCore version 5.1.6 
Copyright (c) 1993 - 2004 Compugen Ltd. 



OM nucleic - nucleic search, using sw model 



Run on: February 28, 2004, 05:52:24 ; Search time 637 Seconds 

(without alignments) 
10216.436 Million cell updates/sec 

Title: US-09-668-314C-1 
Perfect score : 18 04 

Sequence: 1 atgggcgcactggcccgggc aaaccaaaaaaaaaaaaaaa 1804 

Scoring table: IDENTITY_NUC 

Gapop 10.0 , Gapext 1.0 

Searched: 2353733 seqs, 1803733377 residues 



Total number of hits satisfying chosen parameters: 4707466 

Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 

Post-processing: Minimum Match 0% 

Maximum Match 100% 
Listing first 45 summaries 



Database : Published_Applications_NA: * 

1 : /cgn2_6/ptodata/2/pubpna/US07_PUBCOMB. seq: * 

2 : /cgn2__6/ptodata/2/pubpna/PCT_NEW_PUB.seq: * 

3: /cgn2_6/ptodata/2/pubpna/US06_NEW_PUB. seq: * 

4 : /cgn2_6/ptodata/2/pubpna/US06_PUBCOMB. seq: * 

5 : /cgn2_6/ptodata/2/pubpna/US07_NEW_PUB. seq: * 

6 : / cgn2_6/ptodata / 2 /pubpna/ PCTUS_PUBCOMB . seq : * 

7 : /cgn2_6/ptodata/2/pubpna/US08__NEW_PUB. seq: * 

8 : /cgn2_6/ptodata/2/pubpna/US08_PUBCOMB. seq: * 

9 : /cgn2_6/ptodata/2/pubpna/US09A_PUBCOMB. seq: * 
10 : /cgn2_6/ptodata/2/pubpna/US09B_PUBCOMB . seq: * 
11 : /cgn2_6/ptodata/2/pubpna/US09C_PUBCOMB . seq: * 
12 : /cgn2_6/ptodata/2/pubpna/US09_NEW_PUB. seq: * 
13 : /cgn2_6/ptodata/2/pubpna/USlOA_PUBCOMB. seq: * 
14 : /cgn2_6/ptodata/2/pubpna/USlOB_PUBCOMB.seq:* 
15 : /cgn2_6/ptodata/2/pubpna/US10C_PUBCOMB. seq: * 
16: /cgn2_6/ptodata/2/pubpna/US10_NEW_PUB. seq: * 
17 : /cgn2_6/ptodata/2/pubpna/US60_NEW_PUB. seq:* 
18 : /cgn2_6/ptodata/2/pubpna/US60_PUBCOMB. seq:* 

Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 
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RESULT 1 
US-09-794-927-1 

; Sequence 1, Application US/09794927 

; Patent No. US20010016324A1 

; GENERAL INFORMATION: 

; APPLICANT: Gurney, Mark E. 



; APPLICANT: Bienkowski, Michael J. 
; APPLICANT: Heinrikson, Robert L. 
; APPLICANT: Parodi, Luis A. 
; APPLICANT: Yan, Riqiang 

TITLE OF INVENTION: ALZHEIMER'S DISEASE SECRET AS E f APP SUBSTRATES THEREFOR, 

AND 

TITLE OF INVENTION: USES 
TITLE OF INVENTION: THEREFOR 
FILE REFERENCE: 28341/6280FG 
CURRENT APPLICATION NUMBER: US/ 09/7 94 , 927 
CURRENT FILING DATE: 2001-02-27 
PRIOR APPLICATION NUMBER: 09/416,901 
PRIOR FILING DATE: 1999-10-13 
PRIOR APPLICATION NUMBER: 60/155,493 
PRIOR FILING DATE: 1999-09-23 
PRIOR APPLICATION NUMBER: 09/404,133 
PRIOR FILING DATE: 1999-09-23 
PRIOR APPLICATION NUMBER: PCT/US99/2 0881 
PRIOR FILING DATE: 1999-09-23 
PRIOR APPLICATION NUMBER: 60/101,594 
PRIOR FILING DATE: 1998-09-24 
NUMBER OF SEQ ID NOS : 73 
SOFTWARE: Patentln Ver. 2.0 
SEQ ID NO 1 
LENGTH: 1804 
TYPE : DNA 

ORGANISM: Homo sapiens 
US-09-794-927-1 

Query Match 100.0%; Score 1804; DB 9; Length 1804; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 18 04; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

Qy 61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 12 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 12 0 

Qy 121 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 18 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 121 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 180 

Qy 181 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 24 0 

I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 181 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 240 

Qy 241 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II 

Db 241 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 300 

Qy 301 CCCCCGCAGAAGCTACAGATTCTCGTTGACACTGGAAGCAGTAACTTTGCCGTGGCAGGA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 301 C C C C C GCAGAAGCT ACAGAT T CT C GT T GACAC T GGAAGC AGT AACT T T GC CGT GGCAGGA 3 60 



Qy 361 AC C C C G CACT CCT AC AT AGAC AC GT ACT T T GACACAGAGAG GT CTAG C AC AT ACCGCT C C 42 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I M I 

Db 361 AC C C C GCACT CCT AC AT AGAC AC GT ACT T T GACACAGAGAGGT CTAGCAC AT ACCGCT C C 420 

Qy 421 AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 421 AAGG G CT T TGAC GT CACAGT GAAGT AC ACACAAGGAAG CT G GAC GG GCT T C GTT GGGGAA 480 

Qy 481 GAC CT C GT CACC AT C C C CAAAGGCT T CAAT ACT TCTTTTCTTGT CAACAT T G CC ACT AT T 54 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

Db 481 GAC C T C GT CACC AT C C C CAAAGGCT T CAAT ACT TCTTTTCTT GT CAACAT T GCC ACT AT T 54 0 

Qy 541 T T T GAAT CAGAGAAT TTCTTTTTGC CT GG GATTAAAT GGAAT GGAAT ACT T G GCCT AGCT 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 541 T T T GAAT CAGAGAAT TTCTTTTTG C CT GGGATTAAAT GGAAT GGAAT ACT T GGCCT AGCT 600 

Qy 601 TAT G CCACACT T G C CAAGC C AT CAAGT T CT CT GGAGAC CT T CT T C GACT C C CT GGT GACA 660 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 601 TAT GCCACACT T G C CAAGC CAT CAAGT T CT CT GGAGAC CT T CT T C GACT C C CT GGT GACA 660 

Qy 661 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 720 

I I I I I I I I II I I I I I I I I M I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

Db 661 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 720 

Qy 721 GGAT CT GGGACCAACGGAGGTAGT CTT GT CTTGGGT GGAAT T GAAC CAAGT TTGT AT AAA 780 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I M II I I I I I I II I I I I I II I 

Db 721 G GAT CT GG GACCAAC GGAGGT AGT CT T GT CTTGGGT GGAAT T GAAC CAAGT TT GT AT AAA 780 

Qy 781 GGAGAC AT CT GGT AT AC C C CT AT TAAG GAAGAGT GGT ACT AC CAGAT AGAAATT CT GAAA 8 40 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 781 GGAGAC AT CT GGT AT AC C C CT AT T AAGGAAGAGT GGTACT AC CAGAT AGAAATT CT GAAA 840 

Qy 841 T T GGAAAT TGGAGGC CAAAGC CT T AAT CT G GACT GC AGAGAGT ATAAC GCAGACAAGGC C 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I II I I I I I I I I I I I I I I I I 
Db 841 T T GGAAAT T GGAGG C CAAAGC CT T AAT CT G GACT GC AGAGAGT AT AAC GCAGACAAGGC C 900 

Qy 901 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 

I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 901 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 

Qy 961 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1020 

II I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

Db 961 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 102 0 

Qy 1021 CAGC T GG C GT GCT GGAC GAAT T C G GAAACAC CTT GGT CTT ACT T C C CT AAAATCT CC AT C 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I 

Db 1021 CAGCT GGC GT GCT G GAC GAAT T C G GAAACAC CTTGGT CT T ACT T CC CT AAAATCT CCAT C 108 0 

Qy 1081 T AC CT GAGAGAT GAGAACT C C AGCAGGT CAT T CCGT AT CACAAT C CT GC CT CAGCT T T AC 1140 

I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I 

Db 1081 T AC CT GAGAGAT GAGAAC T C CAG C AGGT CAT T CC GT AT CACAAT C CT G C CT CAGCT T T AC 1140 

Qy 1141 ATTCAGCCCATGATGGGGGCCGGCCTGAATTATGAATGTTACCGATTCGGCATTTCCCCA 1200 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 1141 ATTCAGCCCATGATGGGGGCCGGCCTGAATTATGAATGTTACCGATTCGGCATTTCCCCA 12 00 

Qy 1201 TCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGAC 1260 



Db 1201 T C C ACAAAT GCGCT GGT GAT C G GT GC C AC G GTGAT G GAG G GCT T CT AC GT CAT CT T C GAC 1260 

Qy 1261 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 1320 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1261 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 1320 

Qy 1321 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1380 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I 

Db 1321 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1380 

Qy 1381 CAGT CTTT GAGC GAGC C CAT T T T GT G GATT GTGT C C TAT GCGCT CAT GAGCGT CT GT GGA 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1381 CAGTCTTTGAGCGAGCCCATTTTGTGGATTGTGTCCTATGCGCTCATGAGCGTCTGTGGA 144 0 

Qy 1441 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1441 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 

Qy 1501 C GT GAC C CT GAGGT C GT CAAT GAT GAGT CCTCT CT GGT CAGAC AT C GCT GGAAAT GAAT A 1560 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1501 CGTGACCCTGAGGTCGTCAAT GATGAGTCCTCT CT GGT CAGACAT CGCTGGAAAT GAAT A 1560 

Qy 1561 GC CAGGCCTGACCT CAAGCAACCATGAACTCAGCTATTAAGAAAAT CACATTT CCAGGGC 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

Db 1561 GC C AGGCCT GAC CT CAAGCAAC CAT GAACT C AG CT AT T AAGAAAAT C ACATT T C CAGGGC 162 0 

Qy 1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 168 0 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 1680 

Qy 1681 GCTCCCAGATGCCTTCTAGATTCACTGTCTTTTGATTCTTGATTTTCAAGCTTTCAAATC 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1681 GCTCCCAGATGCCTTCTAGATTCACTGTCTTTTGATTCTTGATTTTCAAGCTTTCAAATC 1740 

Qy 1741 C T C C CTACT T C CAAGAAAAATAAT T AAAAAAAAAACTT CAT T CT AAACCAAAAAAAAAAA 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1741 CT C C CTACT T C CAAGAAAAATAAT TAAAAAAAAAACTT CAT T CT AAAC CAAAAAAAAAAA 18 00 

Qy 1801 AAAA 1804 

I I I I 

Db 1801 AAAA 1804 



RESULT 2 
US-09-795-847-1 

Sequence 1, Application US/09795847 
Patent No. US20010018208A1 
GENERAL INFORMATION: 



APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
APPLICANT 
TITLE OF 
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; TITLE OF INVENTION: THEREFOR 

; FILE REFERENCE: 28341/6280DE 

; CURRENT APPLICATION NUMBER: US/09/795, 847 

; CURRENT FILING DATE: 2001-02-28 

; PRIOR APPLICATION NUMBER: 09/416,901 

; PRIOR FILING DATE: 1999-10-13 

; PRIOR APPLICATION NUMBER: 60/155,493 

; PRIOR FILING DATE: 1999-09-23 

; PRIOR APPLICATION NUMBER: 09/404,133 
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SOFTWARE: PatentlnVer. 2.0 
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; ORGANISM: Homo sapiens 
US-09-795-847-1 

Query Match 100.0%; Score 1804; DB 9; Length 1804; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 1804; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I M 

Db 1 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

Qy 61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 12 0 

I I I I I I M I I I I I I I I I I I I I I I I M I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 12 0 

Qy 121 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 180 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I M I II I I I I I I I I I I I I I I I I I I I I 

Db 121 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 18 0 

Qy 181 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 24 0 

I I I I I I I I I | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

Db 181 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 24 0 

Qy 241 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 300 

I | | | | | | | I I I I M I I II M I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 241 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 30 0 

Qy 301 C C C C C GCAGAAG CT AC AGAT T CT C GT T GACACT G GAAGC AGT AACTT T G C C GT GGC AGGA 360 

I I I I I I I I I I II I II I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 301 C C C C C G C AGAAGCT ACAGAT T CT C GT T GACACT GGAAGC AGTAACT T T GC C GT GGC AGGA 360 

Qy 361 ACC C C GCACT CCT AC AT AGAC ACGT ACT T T GACAC AGAGAGGT CT AGC ACAT ACC G CT CC 42 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I 
Db 361 AC C C C GCACT CCT AC AT AGAC AC GT ACT TT GACAC AGAGAGGT CT AG C ACAT ACCGCT C C 42 0 

421 AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 480 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I 

421 AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 480 



Qy 

Db 



Qy 481 GACCTCGTCACCATCCCCAAAGGCTTCAATACTTCTTTTCTTGTCAACATTGCCACTATT 54 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I M I I I I ! I I I I I I I I I 

Db 481 GACCTCGTCACCATCCCCTW^GGCTTCAATACTTCTTTTCTTGTCAACATTGCCACTATT 54 0 

Qy 541 TT T GAAT C AGAGAAT TT CTTTTTGCCT GGGAT TAAAT GGAAT GGAAT ACT T GGC C T AGCT 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 541 TTT GAAT CAGAGAATTTCTTTTTGCCTGGGATTAAAT GGAAT GGAAT ACTTGGCCTAGCT 600 

Qy 601 TAT GC C ACACT T GCCAAGC C AT CAAGT T CTCT GGAGAC CT T C TTCGAC T C C CT G GT GAC A 660 

II I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 601 TAT GCCACACTTGCCAAGCCATCAAGTT CTCT GGAGACCTTCTTCGACTCCCTGGTGACA 660 

Qy 661 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 72 0 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 661 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 720 

Qy 721 GGATCTGGGACCAACGGAGGTAGTCTTGTCTTGGGTGGAATTGAACCAAGTTTGTATAAA 780 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 721 GGATCTGGGACCAACGGAGGTAGTCTTGTCTTGGGTGGAATTGAACCAAGTTTGTATAAA 780 

Qy 781 GGAGACATCTGGTATACCCCTATTAAGGAAGAGTGGTACTACCAGATAGAAATTCTGAAA 840 

I I I I I I I I I I I I I I I I I II I M I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

Db 781 GGAGACATCTGGTATACCCCTATTAAGGAAGAGTGGTACTACCAGATAGAAATTCTGAAA 840 

Qy 841 TT GGAAAT T G GAGGCCAAAGC CT TAAT CT GGACT GCAGAGAGT AT AAC GCAGACAAGGC C 900 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I 

Db 841 T T G GAAAT T GGAGGCCAAAGC CT TAAT CT GGACT G CAGAGAGT AT AAC GC AGACAAGG C C 900 

Qy 901 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 901 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 

Qy 961 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

Db 961 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATT CTCT GAT GGTTTCTGGACTGGGTCC 102 0 

Qy 1021 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 108 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 1080 

Qy 1081 T AC CT GAGAGAT GAGAACT C C AGCAG GT CAT T C C GTAT C ACAAT CCT GC CT C AGCTT T AC 114 0 

I I I I I I M I I I I I I I I I I I I II I I I I I I I I I I II I I II I I I I I I I I I I I I I I I M I I I I I 

Db 1081 T AC CT GAGAGAT GAGAACT C C AGCAGGT CAT T C C GTAT C ACAAT CCT GC CT C AGCT T T AC 114 0 

Qy 1141 AT T CAG C C CAT GATGGGGGC C GGC CT GAATT AT GAAT GT T AC C GATT C GGC AT T T C C C C A 1200 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1141 ATT CAGCCCAT GATGGGGGC CGGCCTGAATTATGAATGTTACCGATTCGGCATTTCC CCA 1200 

Qy 1201 T C C ACAAAT GC G CT GGT GAT C GGT GC CAC GGT GAT GGAGGGCT T CT AC GT CAT CT T C GAC 1260 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 

Db 1201 TCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGAC 1260 



Qy 

Db 



1261 
1261 



1320 



1320 



Qy 1321 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I 

Db 1321 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1380 

Qy 1381 CAGTCTTTGAGCGAGCCCATTTTGTGGATTGTGTCCTATGCGCTCATGAGCGTCTGTGGA 1440 

I I I I I I II I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1381 CAGTCTTTGAGCGAGCCCATTTTGTGGATTGTGTCCTATGCGCTCATGAGCGTCTGTGGA 144 0 

Qy 1441 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 

I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I II I 
Db 1441 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 

Qy 1501 CGTGACCCT GAGGTC GT CAAT GAT GAGTCCTCTCTGGT CAGACAT CGCT GGAAAT GAAT A 1560 

I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

Db 1501 C GT GAC C CT GAG GT C GT CAAT GAT GAGT CCT CT CT GGT CAGACAT CGCT GGAAAT GAAT A 1560 

Qy 1561 GC C AGGC CT GAC CT CAAGCAACCAT GAACTCAGCT AT T AAGAAAAT CACAT TT C C AGGG C 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I 

Db 1561 GCCAGGC CT GAC CT CAAGCAAC CAT GAACT CAGCT AT T AAGAAAAT CACAT T T CC AGGGC 1620 

Qy 1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 1680 

Qy 1681 GCT C C CAG AT G C CT T CT AGAT T CACT GT CTTT T GAT T CT T GAT T T T CAAGCT T T CAAAT C 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 1681 GCT C C C AGAT GC CT T CT AGAT T C ACT GT CTTT T GAT T CT T GAT T T T CAAGCT T T CAAAT C 174 0 

Qy 1741 CTCCCTACTTCCAAGAAAAATAATTAAAAAAAAAACTTCATTCTAAACCAAATWUWWV 1800 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1741 CTCCCTACTTCCAAGAAAAAT7\ATTAAAAAAAAAACTTCATTCTAAACCAA7^AAAAAAA 1800 

Qy 1801 AAAA 1804 

I I I I 

Db 1801 AAAA 1804 
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Query Match 100.0%; Score 1804; DB 9; Length 1804; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 1804; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

Qy 61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 120 

Qy 121 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

Db 121 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 180 

Qy 181 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 181 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 240 

Qy 241 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 300 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 241 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 300 

Qy 301 C C C C C GCAGAAGCT AC AGAT T CT C GTT GAC AC T GGAAGCAGTAACT T T GC C GT GGC AGGA 360 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I 

Db 301 C C C C C GCAGAAGCT AC AGAT T CT C GTT GAC ACT GGAAGCAGTAACT T T GC C GT GGC AG GA 360 

Qy 361 ACCCCGCACT CCT ACAT AGACACGTACTTT GACACAGAGAGGT CTAGCACATACCGCT CC 420 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 361 AC C C C GCACT C CT ACAT AGACAC GT ACT T T GACACAGAGAGGT CTAGCACATACCGCT C C 420 

Qy 421 AAGGGCT T T GAC GT CACAGT GAAGT AC ACACAAGGAAGCT GGAC G GG C TT C GT T GGGGAA 480 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 

Db 421 AAGGG CT T T GAC GT CACAGT GAAGT AC AC ACAAGGAAGCT GGAC G GGCTT C GT T GGGGAA 480 

Qy 481 GACCTCGTCACCATCCCCAAAGGCTTCAATACTTCTTTTCTTGTCAACATTGCCACTATT 540 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 481 GACCTCGTCACCATCCCCAAAGGCTTCAATACTTCTTTTCTTGTCAACATTGCCACTATT 540 

Qy 541 T T T GAAT C AGAGAAT TT C T T T T T GC CT GGGAT TAAAT GGAAT G GAAT ACT T GGC CT AGCT 600 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 541 T T T GAATC AGAGAAT TTCTTTTT GC CT GGGAT TAAAT GGAAT GGAAT ACT T GGC CTAGCT 600 

Qy 601 TATGCCACACTTGCCAAGCCATCAAGTTCTCTGGAGACCTTCTTCGACTCCCTGGTGACA 660 

I I I I I I I I I I I I I I I I I II I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 601 TAT GCCAC ACT T GC CAAGC CAT CAAGTT CT CT GGAGAC CTTCTT C GAC T C C CT G GT GAC A 660 

Qy 661 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 720 

I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I 

Db 661 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 720 

Qy 721 GGATCT GG GAC CAAC GGAGGT AGT CTTGTCTT GG GT GGAAT T GAAC CAAGT TT GT ATAAA 78 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I 
Db 721 GGAT C T GGGAC CAAC GGAGGTAGTCTTGTCTTGGGTGGAATT GAAC CAAGT TTGT AT AAA 780 

Qy 781 GGAGACAT CT GGT AT AC C C CT AT TAAGGAAGAGT GGT ACTAC C AGAT AGAAAT T CT GAAA 840 

I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I | | M | | | | I | | | | | | 

Db 781 GGAGACAT CT GGT AT AC C C CTAT T AAG GAAGAGT GGTACT AC C AGAT AGAAAT T CT GAAA 84 0 

Qy 841 T T GGAAAT T GGAGG C CAAAGC CT TAAT CT G GACT GCAGAGAGT ATAAC GCAGACAAGGC C 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | | | II I I I I 
Db 841 T T G GAAAT T GGAGGC CAAAGC CTTAAT CT GGACTG CAGAGAGT ATAAC GCAGACAAGGC C 900 

Qy 901 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 

I I I I I I M I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I | I | | | | | || 
Db 901 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 

Qy 961 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 961 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 102 0 

Qy 1021 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 1080 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I 

Db 1021 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 1080 

Qy 1081 T ACCT GAGAGAT GAGAACT CCAGCAGGTCATTCCGT ATCACAAT CCT GCCT CAGCTTTAC 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 T AC CT GAGAGAT GAGAACT CCAGCAGGT CATT CCGT AT CACAAT C CT GC CT CAGCT TT AC 1140 

Qy 1141 AT T CAGC C CAT GAT GGGG GC C G GC CT GAATT ATGAAT GT T AC C GAT T C GGCAT T T C C C C A 1200 

I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 1141 ATTCAGCCCATGATGGGGGCCGGCCTGAATTATGAATGTTACCGATTCGGCATTTCCCCA 1200 

Qy 1201 T C CACAAAT G C GCT GGT GAT C GGT GC C ACGGT GAT GGAGGG CT T CT AC GT CAT CT T C GAC 1260 

I I I M I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 1201 TCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGAC 1260 

Qy 1261 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 1320 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I M I I I II II I II I I I II I I I I I I 
Db 1261 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 1320 

Qy 1321 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1321 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1380 

Qy 1381 CAGTCTTTGAGCGAGCCCATTTTGTGGATTGTGTCCTATGCGCTCATGAGCGTCTGTGGA 1440 

I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I M 
Db 1381 CAGTCTTTGAGCGAGCCCATTTTGTGGATTGTGTCCTATGCGCTCATGAGCGTCTGTGGA 1440 



Qy 14 41 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 

I I I II I I II I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I II I I I I I I I I I I I I I I I I 

Db 1441 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 

Qy 1501 C GT GAC C CT GAGGT C GT CAAT GAT GAGT C CT CT CTGGT CAGACAT CGCT GGAAAT GAAT A 1560 

I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1501 C GT GAC C CT GAGGT C GT CAAT GAT GAGT CCTCTCTGGT CAGACAT CGCTGGAAAT GAAT A 1560 

Qy 1561 GC C AGGC CT GAC CT CAAGCAAC CAT GAACT CAGCT AT T AAGAAAAT CACAT T T C CAGGGC 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1561 GC CAG GC CT GAC CT CAAG CAAC CAT GAACT C AG CT AT TAAGAAAAT CACAT TT C CAGGGC 1620 

Qy 1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I l-l I 

Db 1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 1680 

Qy 1681 GCT C C C AGAT GC CT T CT AGAT T CACT GT CT T T T GATT C T T GATTTT CAAGCTTT CAAAT C 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1681 GCTCCCAGATGCCTTCTAGATTCACTGTCTTTTGATTCTTGATTTTCAAGCTTTCAAATC 1740 

Qy 1741 CT C C CT ACT T C CAAGAAAAAT AAT T AAAAAAAAAACTT CAT T CT AAACCAAAAAAAAAAA 1800 

I I I I I I I I I I II I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1741 CT C C CT ACT T C CAAGAAAAAT AATT AAAAAAAAAACT T CAT T CTAAACCAAAAAAAAAAA 1800 

Qy 1801 AAAA 1804 

I I I I 

Db 1801 AAAA 1804 
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US-09-794- 


-748- 


•1 




Query Match 100.0%; Score 1804; DB 9; Length 1804; 
Best Local Similarity 100.0%; Pred. No. 0; 

Matches 1804; Conservative 0; Mismatches 0; Indels 0; Gaps 


0; 


Qy 


X 


AT^nrnrArTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 

1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 


60 


UD 


X 


60 


At -r 

Qy 


OX 


rrrrrnf^A^rTnnrrrrrGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 

I | | | | || II II 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II M 1 1 1 1 1 1 1 1 M 

GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 


120 


Db 


f; 1 

ox 


120 


Qy 


1 O 1 
XZ X 


rrrrT APTTr;rnrrrArrrrGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 

|| | | | | | | | | | 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 

CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 


180 


UD 


XZ X 


180 


Qy 


X a X 


rrrrTrrrrrTn^Af^rrTnrrrTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 

I | | M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 M 1 1 1 II 1 1 1 

GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 


240 


DD 


1 ft 1 
X O X 


240 


Qy 


Z ft X 


rTAr ATA ArrT^rA^n^GGArTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 

\j J_ J^\J/^\^,jt\£\\^ V-* 1 X Vj Vy/lO VJ Vj VJ Vj,JrxV_* X X VJ VJ V* VJ v^ VJ VJ v»» A. A k x — J- J iv- -L vj v^j^ i-J- wwj. j-j. 

1 | 1 1 1 1 1 1 1 1 1 II 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 

GTAGAC7\ACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 


300 


UD 


OA 1 


300 


yy 




CCCCCG CAGAAGCT AC AGATTCT C GTT GAC ACT GGAAGC AGT AACTT T GC C GT GGCAGGA 

I I I I I I I I 1 M 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

C C C C C GCAGAAGCT ACAGATT CT C GT T GAC ACT G GAAGC AGT AACT T T GC C GT GGCAGGA 


360 


UD 


O U _L 


360 


Qy 


361 


AC C C C GCACT C CT AC AT AGACACGT ACT T T GAC AC AGAGAGGT CT AG C ACAT ACCGCT C C 

I M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 

AC C C C GCACT C CT AC AT AGAC AC GT ACTT T GACACAGAGAGGT CTAGC AC AT ACCGCT C C 


420 


Db 


361 


420 


Qy 


421 


AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 

I I I 1 II 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

AAGGGCTTT GACGT C AC AGT GAAGTACACACAAGGAAGCT GGACGGGCTT C GTTGGGGAA 


480 


Db 


421 


480 


Qy 


481 


GAC CT CGTC AC CAT C C C CAAAGGCT T CAATACT T CTTTTCTTGT CAAC AT T GCCACT AT T 

1 M 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 

GAC CT CGT C AC CAT C C C CAAAGGCT T CAATACT T CTTTTCTTGT CAACAT T GCCACT AT T 


540 


Db 


481 


540 


Qy 


541 


TT T GAAT C AGAGAAT T T CTT T T T GC CT GGGAT T AAAT G GAAT GGAAT ACT T GGC CT AGCT 

I | | | | | | | | | | 1 1 1 1 1 1 1 1 1 II 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

TTT GAAT CAGAGAAT TTCTTTTTGCCT GGGAT TAAAT G GAAT GGAAT ACT T GGC CT AGCT 


600 


Db 


541 


600 


Qy 


601 


TAT GCCAC ACT T GC CAAGC CAT CAAGT TCT CT GGAGAC CT T CT T C GACT CCCT GGT GAC A 
| | | | II II 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II II 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 
TAT GCCAC ACT T GC CAAGC CAT CAAGT TCT CT GGAGAC CTT CT T C GACT C CCT G GT GAC A 


660 


Db 


601 


660 



Qy 



661 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 720 



Db 


661 


CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 


720 


Qy 


721 


GGAT CT G GGAC CAAC GGAG GT AGT CT T GT CTT GG GT GGAAT T GAAC CAAGT T T GT ATAAA 

1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 M 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 M 1 1 1 M 1 1 

G GAT CT GGGAC CAAC GGAGGT AGT CTT GT CT T GGGT GGAAT T GAAC CAAGT T T GTAT AAA 


780 


Db 


721 


780 


Qy 


781 


GGAGAC AT CT G GT AT AC C C CT AT T AAGGAAGAGT GGT ACT AC CAGAT AGAAAT T CT GAAA 

1 M 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 M N N 1 1 1 1 1 1 1 1 1 1 1 

GGAGACAT CT GGTAT ACCCCTATTAAGGAAGAGT GGT ACTAC CAGAT AGAAATTCTGAAA 


840 


Db 


781 


840 


Qy 


841 


T T GGAAATT G GAGGC CAAAG C CTTAAT CT G GACT GC AGAGAGT AT AAC GC AGACAAGGC C 

I I I I M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 II 1 M 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 ! 1 1 

T T GGAAAT T GGAG G C CAAAGC CTT AAT CT GGACT GCAGAGAGT ATAAC GC AGACAAGG C C 


900 


Db 


841 


900 


Qy 


901 


ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 

I | || | | | 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 II 1 1 1 II 1 1 1 M 1 1 

ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 


960 


Db 


901 


960 


Qy 

Db 


961 
961 


GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 

I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 II 1 1 II 1 1 1 1 1 1 1 II 1 1 1 1 

GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 


1020 
1020 


Qy 


1021 


CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 

I I I I I I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 M 1 1 1 1 

CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 


1080 


Db 


1021 


1080 


Qy 


1081 


T AC CT GAGAGAT GAGAACT CCAGC AGGT CAT T C C GTAT CACAAT C CT GCCT CAGCT T T AC 
I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
T AC CT GAGAGAT GAGAACT CCAGCAGGT C ATT C C GTAT CACAAT C CT GCCT CAGCTT T AC 


1140 


Db 


1081 


1140 


Qy 


1141 


AT T C AGC C CAT GAT GGGGGCC GG CCT GAAT TAT GAAT GT T AC C GAT T CGGCAT TT C C C C A 
I I I I I I I M I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
AT T CAGC C CAT GAT GGGGGCC GGC CT GAAT TAT GAAT GTT AC C GAT T CGGCAT T T C C C C A 


1200 


Db 


1141 


1200 


Qy 


1201 


TCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGAC 

I I 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

TCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGAC 


1260 


Db 


1201 


1260 


Qy 


1261 


AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 

| I M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 


1320 


Db 


1261 


1320 


Qy 


1321 


GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 

| | | | | | | | | | | | | | | 1 1 1 1 1 1 1 1 1 1 1 1 II II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 


1380 


Db 


1321 


1380 


Qy 


1381 


C AGT CT T T GAGCGAGC C CAT T T T GT G GATT GT GT C CT AT G CGCTCAT GAG C GT CT GT G GA 

1 1 I I M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 

CAGTCTTTGAGCGAGCCCATTTTGTGGATTGTGTCCTATGCGCTCATGAGCGTCTGTGGA 


1440 


Db 


1381 


1440 


Qy 


1441 


GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 

| | | | | | | | 1 1 1 1 1 II 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 M 1 II 

GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 


1500 


Db 


1441 


1500 


Qy 


1501 


C GT GACCCT GAGGT C GT CAAT GAT GAGT C CT CT CT GGT CAGACAT C GCT GGAAAT GAAT A 
| | | | | | | | | | | | | | | 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 M 1 M 1 1 1 1 1 1 1 1 1 


1560 



Db 



1501 C GT GACCCT GAGGT C GTCAAT GAT GAGT CCTCTCTGGT C AGACAT C GCT GGAAAT GAAT A 1560 



Qy 


1561 


GC C AG GCCT GAC CT CAAGCAAC CAT GAACT C AGCT AT T AAGAAAAT CACAT T T CCAGGG C 

I | | | | | | | | 1 1 1 1 M II 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 II 1 1 1 1 M 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 

GC C AGGC CT GAC CT CAAGCAAC CAT GAACT C AGCT AT TAAGAAAAT CACAT T T CC AGGGC 


icon 
X bz U 


Db 


1561 


n con 


Qy 


1621 


AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 

| | | | | I I M 1 1 1 M 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 


icon 


Db 


1621 


1680 


Qy 


1681 


GCT C CCAGAT GC CT T CT AGAT T C ACT GT CT T T T GAT T CT T GATTT T CAAGCT T TCAAAT C 

1 1 1 1 1 1 1 1 1 1 M 1 1 II 1 1 1 1 1 1 1 1 1 1 1 M 1 II 1 1 1 1 1 1 1 1 II 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

GCTCCCAGATGCCTTCTAGATTCACTGTCTTTTGATTCTTGATTTTCAAGCTTTCAAATC 


1740 


Db 


1681 


1740 


Qy 


1741 


CT C C CT ACT T C CAAGAAAAAT AAT T AAAAAAAAAAC T T CAT T CTAAACCAAAAAAAAAAA 

I I I I 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 

CT C C CTACT T C CAAGAAAAAT AATT AAAAAAAAAACT T CAT T CT AAAC CAAAAAAAAAAA 


1800 


Db 


1741 


1800 



Qy 1801 AAAA 1804 

I I I I 

Db 1801 AAAA 1804 



RESULT 5 
US-09-794-925-1 

Sequence 1, Application US/09794925 
Patent No. US20020064819A1 
GENERAL INFORMATION: 
APPLICANT: Gurney, Mark E. 
APPLICANT: Bienkowski, Michael J. 
APPLICANT: Heinrikson, Robert L. 
APPLICANT: Parodi, Luis A. 
APPLICANT: Yan, Riqiang 

TITLE OF INVENTION: ALZHEIMER'S DISEASE SECRETASE, APP SUBSTRATES THEREFOR, 

AND USES 

TITLE OF INVENTION: THEREFOR 
FILE REFERENCE: 28341/6280HI 
CURRENT APPLICATION NUMBER: US/ 09/794 , 925 
CURRENT FILING DATE: 2001-02-27 
PRIOR APPLICATION NUMBER: 09/416,901 
PRIOR FILING DATE: 1999-10-13 
PRIOR APPLICATION NUMBER: 60/155,493 
PRIOR FILING DATE: 1999-09-23 
PRIOR APPLICATION NUMBER: 09/404,133 
PRIOR FILING DATE: 1999-09-23 
PRIOR APPLICATION NUMBER: PCT/US99/20881 
PRIOR FILING DATE: 1999-09-23 
PRIOR APPLICATION NUMBER: 60/101,594 
PRIOR FILING DATE: 1998-09-24 
NUMBER OF SEQ ID NOS : 73 
SOFTWARE: Patentln Ver. 2.0 
SEQ ID NO 1 
LENGTH: 1804 
TYPE: DNA 

ORGANISM: Homo sapiens 
US-09-794-925-1 



Query Match 100.0%; Score 1804; DB 9; Length 1804; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 1804; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 

Db 1 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

Qy 61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 12 0 

I I II I I I I I I I I I I I I I I I I I I I I I I II I M I I I I II I I I I I I I I I I I M I I I I I I I I I I 

Db 61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 12 0 

Qy 121 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 18 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I M I I I I I I I I I I I I I I 

Db 121 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 18 0 

Qy 181 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 24 0 

I I M I I I I I I I I I I I I I I I I I I I I I I I M I II I I I I I I II I I I I I I I I I I I I I I I I I I I I 

Db 181 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 24 0 

Qy 241 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 300 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 241 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 300 

Qy 301 C C C CC GCAGAAGCT ACAGAT T CT C GTT GACACT GGAAGCAGT AACT T T GC C GT GGC AGGA 360 

I I I I I I I I I I I M I I I I I I I I I I I M I I I I I I I M I I I I I I I I I II I I I I I I II I I I I I I 
Db 301 C C C C C GCAGAAGCT AC AGAT T CT C GTT GACACT G GAAGCAGTAACTT T GC C GT G GCAGGA 360 

Qy 361 AC C C C GC ACT CCT AC AT AGACAC GTACTT T GAC ACAGAGAGGT CT AGC AC AT AC C GCT CC 42 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 AC C C C GCACT CCT ACAT AGACAC GT ACTT T GAC AC AGAGAGGT CT AGC AC AT AC C GCTCC 420 

Qy 421 AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 48 0 

I I I I M I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 421 AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 48 0 

Qy 481 GAC CT C GT C AC CAT C C C CAAAGGCT T CAAT ACTT CT T T T CTT GT CAAC AT T GC CACTATT 54 0 

I | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I M I I M I I I 

Db 481 GAC CT C GT CAC CAT C C C CAAAGG CTT CAAT ACT T CT T T T CT T GTCAAC AT T G C CACTATT 54 0 

Qy 541 T T T GAAT C AGAGAAT TTCTTTTTGCCT GGGAT T AAAT GGAAT GGAAT ACT T GGC CT AG CT 600 

M I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I 
Db 541 T T T GAAT C AGAGAAT TTCTTTTTGCCT GGGAT T AAAT GGAAT G GAAT ACT T GGC CTAGCT 600 

Qy 601 T AT GCCAC ACT T GC CAAGC C AT CAAGT T CTCT GGAGAC CT T CT T CGACT C C CT GGT GACA 660 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 TATGCCACACTTGCCAAGCCATCAAGTTCTCTGGAGACCTTCTTCGACTCCCTGGTGACA 660 

Qy 661 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 72 0 

I | I I I I I I || I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 

Db 661 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 720 

Qy 721 GGAT CT GGGAC CAACGGAG GT AGT CT T GT CTT GGGT GGAAT T GAAC CAAGT T T GT AT AAA 78 0 

I M I I I I I I I I I I I I II I I I I I II I II II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 GGAT CTGGGACCAACGGAGGTAGTCTTGT CTT GGGT GGAATTGAACCAAGTTTGT AT AAA 780 



Qy 



781 GGAGAC AT CT GGT AT ACC C CT AT T AAGGAAGAGT GGT ACT AC C AGAT AGAAAT T CT GAAA 840 



Db 


781 


Qy 


841 


Db 


841 


Qy 


901 


Db 


901 


Qy 


961 


Db 


961 


Qy 


1021 


Db 


1021 


Qy 


1081 


Db 


1081 


Qy 


1141 


Db 


1141 


Qy 


1201 


Db 


1201 


Qy 


1261 


Db 


1261 


Qy 


1321 


Db 


1321 


Qy 


1381 


Db 


1381 


Qy 


1441 


Db 


1441 


wy 


1 SOI 


Db 


1501 


Qy 


1561 


Db 


1561 


Qy 


1621 



I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I M I I I 

GGAGACATCTGGTATACCCCTATTAAGGAAGAGTGGTACTACCAGATAGAAATTCTGAAA 840 

TTGGAAATTGGAGGCCAAAGCCTTAATCTGGACTGCAGAGAGTATAACGCAGACAAGGCC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TTGGAAATTGGAGGCCAAAGCCTTAATCTGGACTGCAGAGAGTATAACGCAGACAAGGCC 900 

ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 



I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1020 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



TACCTGAGAGATGAGAACTCCAGCAGGTCATTCCGTATCACAATCCTGCCTCAGCTTTAC 1140 
I | | | I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



I I I I M II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

ATTCAGCCCATGATGGGGGCCGGCCTGAATTATGAATGTTACCGATTCGGCATTTCCCCA 1200 

TCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGAC 12 60 
I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1380 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 



I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



M I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



| | | | || | | | | | I I I I I I I I I I I I I I II II I I I I II I II I I I I I I I I I I I II I I I I I I I II 



Db 



1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 168 0 



Qy 1681 GCT C CCAGAT GC CT T CT AGAT T CACT GT CT TT T GAT T CT T GATT T T CAAGCT T T CAAAT C 17 4 0 

I I I M I I I M II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M M I I I I I I I I I I I I 
Db 1681 GCT C CCAGAT G C CT T CTAGAT T CACT GT CTT T T GAT T CT T GAT T T T CAAGCT T T CAAAT C 1740 

Qy 1741 CT C C CTACT T C CAAGAAAAAT AAT T AAAAAAAAAACT T CAT T CT AAAC CAAAAAAAAAAA 1800 

I I I I I I I I I I I I I I I I I II M I I I I I I I I M I I II I I I I I I I I II I I I I I I I I I II I I II 
Db 17 41 CT C C CTACT T C CAAGAAAAAT AAT TAAAAAAAAAACT T C ATT CTAAAC CAAAAAAAAAAA 18 00 

Qy 1801 AAAA 1804 

I I I I 

Db 1801 AAAA 1804 



RESULT 6 
US-09-681-442-1 

; Sequence 1, Application US/09681442 
Patent No. US20020081634A1 
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TITLE OF INVENTION: THEREFOR 
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SEQ ID NO 1 
LENGTH: 1804 
TYPE: DNA 

ORGANISM: Homo sapiens 
US-09-681-442-1 

Query Match 100.0%; Score 1804; DB 9; Length 1804; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 1804; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

I I I I I I I I I I I I I I I I I I I I I I M I I M I N II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 



Qy 61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 120 

Qy 121 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 

Db 121 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 180 

Qy 181 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 181 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 240 

Qy 241 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 241 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 300 

Qy 301 CCCCCGCAGAAGCTACAGATTCTCGTTGACACTGGAAGCAGTAACTTTGCCGTGGCAGGA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

Db 301 CCCCCGCAGAAGCTACAGATTCTCGTTGACACTGGAAGCAGTAACTTTGCCGTGGCAGGA 360 

Qy 361 AC C C C GC ACT CCT ACAT AGACAC GT ACT T T GAC AC AGAGAG GT CT AGC ACAT AC C GCT C C 420 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 361 ACCCCGCACTCCTACATAGACACGTACTTTGACACAGAGAGGTCTAGCACATACCGCTCC 420 

Qy 421 AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 480 

I I I I I II I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 421 AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 480 

Qy 481 GACCTCGTCACCATCCCCAAAGGCTTCAATACTTCTTTTCTTGTCAACATTGCCACTATT 540 

I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I 
Db 481 GACCTCGTCACCATCCCCAAAGGCTTCAATACTTCTTTTCTTGTCAACATTGCCACTATT 540 

Qy 541 TTTGAATCAGAGAATTTCTTTTTGCCTGGGATTAAATGGAATGGAATACTTGGCCTAGCT 600 

I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I 

Db 541 TTTGAATCAGAGAATTTCTTTTTGCCTGGGATTAAATGGAATGGAATACTTGGCCTAGCT 600 

Qy 601 TATGCCACACTTGCCAAGCCATCAAGTTCTCTGGAGACCTTCTTCGACTCCCTGGTGACA 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 601 TATGCCACACTTGCCAAGCCATCAAGTTCTCTGGAGACCTTCTTCGACTCCCTGGTGACA 660 

Qy 661 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 720 

I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 661 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 720 

Qy 721 GGATCTGGGACCAACGGAGGTAGTCTTGTCTTGGGTGGAATTGAACCAAGTTTGTATAAA 780 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 721 GGATCTGGGACCAACGGAGGTAGTCTTGTCTTGGGTGGAATTGAACCAAGTTTGTATAAA 780 

Qy 781 GGAGACAT CT GGT AT ACCC CT ATTAAGGAAGAGT GGT ACT ACCAGAT AGAAATT CT GAAA 840 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 781 GGAGACATCTGGTATACCCCTATTAAGGAAGAGTGGTACTACCAGATAGAAATTCTGAAA 840 

Qy 841 TTGGAAATTGGAGGCCAAAGCCTTAATCTGGACTGCAGAGAGTATAACGCAGACAAGGCC 900 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I 

Db 841 TTGGAAATTGGAGGCCAAAGCCTTAATCTGGACTGCAGAGAGTATAACGCAGACAAGGCC 900 



Qy 



901 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 



I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I i I I I I M I I II I I I I I I I I I I I I 

Db 901 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 

Qy 961 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

Db 961 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 102 0 

Qy 1021 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 108 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 1080 

Qy 1081 TACCT GAGAGAT GAGAACT C CAGCAGGT CAT T C C GT AT C ACAAT C CT G C CT CAGCT T T AC 1140 

I I I I I I I I I I I I I I I I I I I II I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I . 
Db 1081 TACCT GAGAGAT GAGAACT C CAGCAGGT CAT T C C GT AT C ACAAT C CT G C CT C AGCT T T AC 114 0 

Qy 1141 ATTCAGCCCATGATGGGGGCCGGCCTGAATTATGAATGTTACCGATTCGGCATTTCCCCA 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1141 ATT CAGC C CAT GAT GGGG G C C GG C CT GAATT AT GAAT GT T AC C GAT T C GGCAT TT C C C C A 1200 

Qy 1201 TCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGAC 1260 

I | | I M I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1201 TCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGAC 1260 

Qy 1261 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 132 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1261 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 1320 

Qy 1321 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1380 

I I I I I I I M I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 1321 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 138 0 

Qy 1381 CAGTCTTTGAGCGAGCCCATTTTGTGGATTGTGTCCTATGCGCTCATGAGCGTCTGTGGA 144 0 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1381 CAGTCTTTGAGCGAGCCCATTTTGTGGATTGTGTCCTATGCGCTCATGAGCGTCTGTGGA 144 0 

Qy 1441 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1441 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 

Qy 1501 CGTGACCCTGAGGTCGTCAATGATGAGTCCTCTCTGGTCAGACATCGCTGGAAATGAATA 1560 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 1501 CGTGACCCTGAGGTCGTCAATGATGAGTCCTCTCTGGTCAGACATCGCTGGAAATGAATA 1560 

Qy 1561 GCCAGGCCTGACCTCAAGCAACCATGAACTCAGCTATTAAGAAAATCACATTTCCAGGGC 162 0 

I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 1561 GCCAGGCCTGACCTCAAGCAACCATGAACTCAGCTATTAAGAAAATCACATTTCCAGGGC 1620 

Qy 1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 

Db 1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 1680 

Qy 1681 GCTCCCAGATGCCTTCTAGATTCACTGTCTTTTGATTCTTGATTTTCAAGCTTTCAAATC 1740 

I I M I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I 
Db 1681 GCTCCCAGATGCCTTCTAGATTCACTGTCTTTTGATTCTTGATTTTCAAGCTTTCAAATC 1740 

Qy 1741 CTCCCTACTTCCAAGAAAAATAATTAAAAAAAAAACTTCATTCTAAACCAAAAAAAAAAA 1800 

I | | || I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 



Db 1741 CTCCCTACTTCCAAGAAAAATAATTAAAAAAAAAACTTCATTCTAAACCAAAAAAAAAAA 1800 



Qy 1801 AAAA 1804 

I I I I 

Db 1801 AAAA 1804 



RESULT 7 
US-09-869-414-1 

Sequence 1, Application US/09869414 
Publication No. US20030077226A1 
GENERAL INFORMATION: 
APPLICANT: Beinkowski et al . 

TITLE OF INVENTION: ALZHEIMER'S DISEASE SECRETASE, APP SUBSTRATES THEREFOR, 
AND USES 

TITLE OF INVENTION: THEREFOR 
FILE REFERENCE: 28341/6280M 

CURRENT APPLICATION NUMBER: US/09/8 69, 4 14 
CURRENT FILING DATE: 2001-06-27 
PRIOR APPLICATION NUMBER: 09/416,901 
PRIOR FILING DATE: 1999-10-13 
PRIOR APPLICATION NUMBER: 60/155,493 
PRIOR FILING DATE: 1999-09-23 
PRIOR APPLICATION NUMBER: 09/404,133 
PRIOR FILING DATE: 1999-09-23 
PRIOR APPLICATION NUMBER: PCT/US99/20881 
PRIOR FILING DATE: 1999-09-23 
PRIOR APPLICATION NUMBER: 60/101,594 
PRIOR FILING DATE: 1998-09-24 
NUMBER OF SEQ ID NOS : 7 3 
SOFTWARE: PatentlnVer. 2.0 
SEQ ID NO 1 
LENGTH: 18 04 
TYPE: DNA 

ORGANISM: Homo sapiens 
US-09-869-414-1 



Query Match 100.0%; Score 1804; 

Best Local Similarity 100.0%; Pred. No. 0; 
Matches 1804; Conservative 0; Mismatches 



DB 10; Length 18 04; 

0; Indels 0; Gaps 



0; 



Qy 

Db 



1 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

I I I I I I I I I I I I I I I I I I I I I! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 



QY 
Db 

Qy 

Db 

Qy 

Db 



61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I 

61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 120 

121 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 180 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

121 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 180 

181 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 240 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

181 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 240 



Qy 241 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 241 GT AGACAAC C T GC AG GGG GAC T CT GGC C GC GGCT ACT ACCT GGAGAT GCT GAT CGGGAC C 300 

Qy 301 CCCCCGCAGAAGCTACAGATTCTCGTTGACACTGGAAGCAGTAACTTTGCCGTGGCAGGA 360 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 301 CCCCCGCAGAAGCTACAGATTCTCGTTGACACTGGAAGCAGTAACTTTGCCGTGGCAGGA 360 

Qy 361 AC C C C GC ACT C CT AC AT AGAC AC GT ACT T T GACACAGAGAGGT CT AGCACAT ACCGCT C C 420 

I I I I I I I I I I I I I I I I I I I II I I I 1 I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I 

Db 361 ACCCCGCACT CCTACATAGACACGT ACTTT GACACAGAGAGGTCTAGCACAT ACCGCT CC 420 

Qy 421 AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 4 80 

I I I I I II I I I I I II I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

Db 421 AAGGGCTTT GAC GT CACAGT GAAGT ACACACAAGGAAGCTGGAC GGGCTT CGTTGGGGAA 480 

Qy 481 GACCTCGTCACCATCCCCAAAGGCTTCAATACTTCTTTTCTTGTCAACATTGCCACTATT 540 

I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 481 GAC C T C GT C AC CAT C C C C AAAG G C T T C AAT AC TTCTTTTCTTGT C AAC AT T G C C ACT AT T 540 

Qy 541 TTTGAATCAGAGAATTTCTTTTTGCCTGGGATTAAATGGAATGGAATACTTGGCCTAGCT 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 541 T T T GAAT C AGAGAAT TTCTTTTTGCCT GGGATT AAAT GGAATGGAAT ACTT GGCCT AGCT 600 

Qy 601 TATGCCACACTTGCCAAGCCATCAAGTTCTCTGGAGACCTTCTTCGACTCCCTGGTGACA 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 601 TATGCCACACTTGCCAAGCCATCAAGTTCTCTGGAGACCTTCTTCGACTCCCTGGTGACA 660 

Qy 661 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 720 

I I I I II I I I I I I I I I I I I I II I I I M I I II I I I I I I I I I I I I I I I I II II I I I I I I I I I I 

Db 661 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 720 

Qy 721 GGAT CT GGGACCAACGGAGGTAGT CTT GT CTT GGGT GGAATT GAACCAAGTTT GTATAAA 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I II I I I I 

Db 721 G GAT CT G GGAC CAAC GGAGGT AGT CT T GT CTT GGGT GGAATT GAACCAAGTTT GTATAAA 780 

Qy 781 G GAGACAT CT GGT AT AC C C CT AT T AAGGAAGAGT GGTACT ACCAGAT AGAAATT CT GAAA 840 

I I I M I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I M I 

Db 781 GGAGACAT CT GGTAT ACCCCT ATTAAGGAAGAGT GGTACT ACCAGAT AGAAATT CTGAAA 840 

Qy 841 T T GGAAAT T GGAG GC CAAAGC CT T AAT CT GGACT GCAGAGAGT AT AACGCAGACAAGGC C 900 

I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

Db 841 T T GGAAAT T GGAGGC CAAAGC CT T AAT CT GGACT GCAGAGAGT AT AACGCAGACAAGGCC 900 

Qy 901 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 

I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 901 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 

Qy 961 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1020 

I I II I I II I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I II I 

Db 961 GAAGCT GT GG C C C GC GC AT CT CT GAT T C CAGAAT T CT CT GAT GGTTT CT GGACT GGGT CC 1020 

Qy 1021 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 1080 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 1021 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 1080 



Qy 1081 T AC CT GAGAGAT GAGAACT C C AGCAG GT CAT T C C GT AT CAC AAT CCT GC CT CAGCTTTAC 1140 



I I I I I I I I I I I I I I 1 I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I M II I I I I I I I I 

Db 1081 T AC CT GAGAGAT GAGAACT C CAGCAGGTC AT T C C GTAT CACAAT C CT GCCT CAGC T T T AC 1140 

Qy 1141 AT T C AGCC CAT GAT G GGG GC C GGC CT GAAT TAT GAAT GT T AC C GAT T CGGC AT T T C C C C A 1200 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I II I I M I I I I II I 
Db 1141 ATTCAGCCCATGATGGGGGCCGGCCTGAATTATGAATGTTACCGATTCGGCATTTCCCCA 1200 

Qy 12 01 TCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGAC 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 12 01 TCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGAC 12 60 

Qy 12 61 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I 

Db 1261 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 132 0 

Qy 1321 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1380 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I M 

Db 1321 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1380 

Qy 13 81 CAGTCTTTGAGCGAGCCCATTTTGTGGATTGTGTCCTATGCGCTCATGAGCGTCTGTGGA 1440 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1381 CAGT CTTT GAG C GAGC C CAT T T T GT GGATT GT GT C CT AT GC GCT CAT GAGCGT CT GT GGA 1440 

Qy 1441 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 

I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1441 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 

Qy 1501 C GT GAC CCT GAGGT C GT CAAT GAT GAGT CCTCT C T GGT CAGAC AT CGCT GGAAAT GAAT A 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1501 C GT GAC CCT GAGGT C GT CAAT GAT GAGT CCT CT CT GGT CAGAC AT CGCT GGAAAT GAAT A 1560 

Qy 1561 GC C AGGCCT GACCT CAAG CAAC CAT GAACT CAGCT AT T AAGAAAAT CAC ATTT CC AGG GC 1620 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I 

Db 15 61 GC C AG GC CTGAC CT CAAGCAAC CAT GAACT CAGCT AT T AAGAAAAT CAC ATTT CCAGGGC 1620 

Qy 1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 168 0 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 168 0 

Qy 1681 GCTCCCAGATGCCTTCTAGATTCACTGTCTTTTGATTCTTGATTTTCAAGCTTTCAAATC 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1681 GCTCCCAGATGCCTTCTAGATTCACTGTCTTTTGATTCTTGATTTTCAAGCTTTCAAATC 174 0 

Qy 1741 CT C C CT ACTT CCAAGAAAAAT AAT T AAAAAAAAAACT T CAT T CT AAAC CAAAAAAAAAAA 1800 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I M I 

Db 17 41 CT C C CT ACTT CCAAGAAAAAT AAT T AAAAAAAAAACT T CAT T CTAAAC CAAAAAAAAAAA 18 00 

Qy 1801 AAAA 1804 

I I I I 

Db 1801 AAAA 1804 



RESULT 8 
US-09-548-366-1 

; Sequence 1, Application US/09548366 
; Publication No. US20030104365A1 
; GENERAL INFORMATION: 



APPLICANT: Gurney, Mark E. 
APPLICANT: Bienkowski, Michael J. 
APPLICANT: Heinrikson, Robert L. 
APPLICANT: Parodi, Luis A. 
APPLICANT: Yan, Riqiang 

TITLE OF INVENTION: ALZHEIMER'S DISEASE SECRETASE, APP SUBSTRATES THEREFOR, 
AND 

TITLE OF INVENTION: USES THEREFOR 
FILE REFERENCE: 28341/6280A 
CURRENT APPLICATION NUMBER: US/ 09/54 8 , 366 
CURRENT FILING DATE: 2000-04-12 
PRIOR APPLICATION NUMBER: 60/155,493 
PRIOR FILING DATE: 1999-09-23 
PRIOR APPLICATION NUMBER: 09/404,133 
PRIOR FILING DATE: 1999-09-23 
PRIOR APPLICATION NUMBER: PCT/US99/20881 
PRIOR FILING DATE: 1999-09-23 
PRIOR APPLICATION NUMBER: 60/101,594 
PRIOR FILING DATE: 1998-09-24 
NUMBER OF SEQ ID NOS : 65 
SOFTWARE: Patentln Ver. 2.0 
SEQ ID NO 1 
LENGTH: 18 04 
TYPE: DNA 

ORGANISM: Homo sapiens 
US-09-548-366-1 

Query Match 100.0%; Score 1804; DB 10; Length 1804; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 18 04; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 

Db 1 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

Qy 61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 120 

I M I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I M I I I I I I I I I I I I I 

Db 61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 12 0 

Qy 121 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 180 

I | | | | | | | | | | II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 

Db 121 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 18 0 

Qy 181 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 24 0 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 

Db 181 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 24 0 

Qy 241 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 300 

I | | I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I M I II I I I M I I I I I I I I I I I I I I I 

Db 241 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 300 

Qy 301 C C C C CGCAGAAGCT ACAGAT T CT C GT T GAC ACT GGAAGCAGT AACT T T G C C GT G GC AGGA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 301 CCCCCGCAGAAGCTACAGATTCTCGTTGACACTGGAAGCAGTAACTTTGCCGTGGCAGGA 360 

Qy 361 AC C CCGCACT C CT AC AT AGACAC GT ACTT T GAC AC AGAGAGGT CT AGCAC AT AC C GCT C C 42 0 

| | | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 


361 


ACC C C G C AC T C CT ACAT AGACAC GT ACT T T GACACAG AGAGGT CT AGCAC AT AC C GCT CC 


4z U 


Qy 


421 


AAG GGCT T T GAC GT CAC AGT GAAGT ACACACAAGGAAG CT GGAC GGGCT T C GT T GGGGAA 

| | | | | | | | | I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 II 1 1 1 1 1 1 1 II II 1 1 1 M 1 M 

AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 


/ion 
4 o U 


Db 


421 


A O C\ 

4 o U 


Qy 


481 


GACCT C GT CAC CAT C CC CAAAGGCTT CAAT AC TTCTTTTCTTGT CAACATT G C CACT ATT 

I I I I I I 1 I 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 II 1 1 II 

GAC C T C GT CAC CAT C C C CAAAGGCTT CAAT ACT T CTTT T CT T GT CAAC AT T GC CACT ATT 


o4 U 


Db 


481 


540 


Qy 


541 


TT T GANV C AGAGAAT TTCTTTTTGCCT GGGAT T AAAT GGAAT GGAAT ACTT GGC CT AGCT 
| | | | I I I I I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 
TT T GAAT C AGAGAAT TTCTTTTTGCCT GGGAT T AAAT G GAAT GGAAT ACT T GGC CT AGCT 


r~ r\ r\ 

600 


Db 


541 


600 


Qy 


601 


TATGCCACACTTGCCAAGCCATCAAGTTCTCTGGAGACCTTCTTCGACTCCCTGGTGACA 

I | | | II | 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 II II 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 M 1 

TAT G CCACACT T GC CAAG C CAT CAAGT T CT CT GGAGAC CT T CT T CGACT C C CT GGT GACA 


660 


Db 


601 


s~ s~ t~\ 

660 


Qy 


661 


CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 

| | | | | | | | | | | | | 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 M 1 1 1 1 1 1 1 1 

CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 


720 


Db 


661 


720 


Qy 


721 


GGAT CT GGGAC CAAC GGAGGT AGT CT T GT CT T GGGT GGAAT T GAAC CAAGT T T GT ATAAA 

1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

GGAT CTGGGACCAACGGAGGTAGTCTTGTCTT GGGT GGAATT GAAC CAAGTTTGT AT AAA 


780 


Db 


721 


780 


Qy 


781 


GGAGACAT CT GGT AT AC C C CT AT T AAGGAAGAGT GGT ACT AC CAGAT AGAAAT T CT GAAA 
| M 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
GGAGACAT CT GGT AT AC C C CTAT TAAGGAAGAGTGGT ACT AC CAGAT AGAAAT T CT GAAA 


840 


Db 


781 


840 


Qy 


841 


T T GGAAAT T GGAGG C CAAAGCCT T AAT CT GGACT G C AGAGAGT AT AAC GCAGACAAG GC C 

M 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 

T T GGAAAT T GGAGGCCAAAGCCT TAAT CT GGACT GCAGAGAGTAT AAC GCAGACAAGGC C 


900 


Db 


841 


900 


Qy 


901 


ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 

| | | I I I I I 1 I 1 1 1 1 M 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 

ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 


960 


Db 


901 


r\ s~ r\ 

960 


Qy 

Db 


961 
961 


GAAGCTGT GGC CCGCGCATCTCTGATTCCAGAATTCTCT GAT GGTTTCT GGACT GGGT CC 

I M | I I I M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 M 1 1 1 1 

GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 


1020 
1020 


Qy 


1021 


CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 

| | | 1 II 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTA7\AATCTCCATC 


1 a n n 

1080 


Db 


1021 


1080 


Qy 


1081 


TAC CT GAGAGAT GAGAACT C CAGC AGGT CATT C C GT AT CACAAT C CT GC CT CAGCT T T AC 
I I I I I I I I M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 
T AC CT GAGAGAT GAGAACT C CAGC AGGT CATT C CGT AT CACAAT C CT G C CT CAGCT T TAC 


1140 


Db 


1081 


i t a r\ 

1140 


Qy 

Db 


1141 
1141 


AT T CAGCC CAT GAT GGGGG C C G GC CT GAATT AT GAAT GT TAC C GAT T C GGCATTT C C C CA 

| | M 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 

ATT CAGCCCAT GAT GGGGGCCGGCCT GAATT AT GAAT GTTACCGATTCGGCATTTCCCCA 


1200 
1200 


Qy 


1201 


TCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGAC 

| | | | | | | | | || | | | | | | 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 II 1 1 1 II 1 1 M M 1 1 1 1 1 1 1 

T C CACAAAT GC GCT GGTGAT C G GT G C CACGGT GAT GGAGGGCT T CT AC GT CAT CT T C GAC 


1260 


Db 


1201 


1260 



Qy 12 61 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 1320 

I | | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I II I I I I I I I I I I I I 

Db 12 61 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 1320 

Qy 1321 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1380 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 1321 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1380 

Qy 1381 C AGT C TT T GAG C GAGC C C AT TTT GT GGATT GT GT C CT AT G C GCT CAT GAG C GT CT GT GGA 1440 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 1381 CAGTCTTTGAGCGAGCCCATTTTGTGGATTGTGTCCTATGCGCTCATGAGCGTCTGTGGA 1440 

Qy 1441 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1441 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 

Qy 1501 C GT GAC C CT GAGGT C GT CAAT GAT GAGT CCT CT CT GGT CAGAC AT C GCT G GAAAT GAAT A 1560 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I 
Db 1501 C GT GAC CCT GAG GT C GT CAAT GAT GAGT CCT CT CT GGT CAGACAT C G CT GGAAAT GAAT A 1560 

Qy 1561 GC C AGG C CT GAC CT CAAGCAAC CAT GAACT C AGCT AT TAAGAAAAT CAC AT T T CCAGGGC 1620 

I I I I I M I M I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1561 GC C AGGC CT GAC CT CAAGCAAC CAT GAACT CAGCT AT TAAGAAAAT CACATT T C CAG GGC 1620 

Qy 1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I 

Db 1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 1680 

Qy 1681 GCT C C CAGAT GC CT T CT AGAT T CACT GT CTT TT GAT T CT T GAT TTT CAAGCT T T CAAAT C 1740 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I M I I I I I I II I I I I I I I I I 

Db 1681 GCT CC CAGAT GC CT T CT AGAT T CACT GT CTTTTGAT T CT T GATT T T CAAGCT T T CAAAT C 17 4 0 

Qy 1741 CT C C CT ACT T C CAAGAAAAAT AAT TAAAAAAAAAACT T CAT T CT AAAC CAAAAAAAAAAA 18 00 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 1741 CT C C CT ACT T C CAAGAAAAAT AAT TAAAAAAAAAACT T CAT T CT AAAC CAAAAAAAAAAA 18 00 

Qy 1801 AAAA 1804 

I I I I 

Db 1801 AAAA 1804 
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Query Match 98.9%; Score 1784.4; DB 9; Length 1879; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 1785; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 

Qy 1 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 94 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 153 

Qy 61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 120 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I M I I I I I I I I I I I I M I I II I I I I I I I I I 

Db 154 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 213 

Qy 121 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 214 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 273 

Qy 181 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 24 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 274 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 333 

Qy 241 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 300 

I I I I I I I I I I I I I II I I I I I I I I I I II II I I I II I I I I II I I I I I I I I I I I I I I I I I I I I 

Db 334 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 393 

Qy 301 C C C C C G CAGAAGCT ACAGAT T CT C GT T GACACT GGAAGCAGT AACT T T GCCGT GGCAGGA 360 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I II I I II I I II 1 I I I 

Db 394 CCCCCGCAGAAGCTACAGATTCTCGTT GACACT GGAAGCAGT AACTTTGCCGT GGCAGGA 453 

Qy 361 ACCCCGCACT CCTACAT AGACACGT ACTTTGACACAGAGAGGT CTAGCACATAC CGCT CC 42 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 454 ACCCCGCACT CCTACAT AGACACGT ACTTTGACACAGAGAGGT CT AGCACATACCGCT CC 513 

Qy 421 AAGGGCTTT GACGT CACAGT GAAGTACACACAAGGAAGCT GGACGGGCTTCGTT GGGGAA 480 

I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 
Db 514 AAGGGCTTT GACGT CACAGT GAAGTACACACAAGGAAGCT GGACGGGCTTCGTT GGGGAA 57 3 



Qy 

Db 



481 
574 



540 
633 



Qy 


541 


Db 


634 


Qy 


601 


Db 


694 


Qy 


661 


Db 


754 


Qy 


721 


Db 


814 


Qy 


781 


Db 


874 


Qy 


841 


Db 


934 


Qy 


901 


Db 


994 


Qy 


961 


Db 


1054 


Qy 


1021 


Db 


1114 


Qy 


1081 


Db 


1174 


Qy 


1141 


Db 


1234 


Qy 


1201 


Db 


1294 


Qy 


1261 


Db 


1354 


Qy 


1321 


Db 


1414 



TTTGAATCAGAGAATTTCTTTTTGCCTGGGATTAAATGGAATGGAATACTTGGCCTAGCT 600 

M | | | | | I I I I I I I I I I I I II I I I II II I I I II I I II I I I I I I I I I I I I I I I I I I I I M I 

TTT GAAT CAGAGAATTTCTTTTTGCCTGGGATTAAAT GGAAT GGAAT ACTT GGCCTAGCT 693 

TAT GC CACACT T GCCAAGCCATCAAGTT CTCT G GAGAC CT T CT T C GACT C C CT GGT GACA 660 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I M I 

TATGCCACACTTGCCAAGCCATCAAGTTCTCTGGAGACCTTCTTCGACTCCCTGGTGACA 753 

CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 720 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 813 

GGAT CT G GGAC CAACGGAGGT AGT CT TGTCTTGGGTG GAAT T GAAC CAAGTT T GT AT AAA 7 8 0 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I M I I I I I I I I I I I I I I I I I I I I I I I 

GGAT CT GGGAC CAACGGAGGT AGT CT T GT CT T G GGT GGAAT T GAAC CAAGT T T GT AT AAA 873 

GGAGACAT CT GGTATACCCCTATTAAGGAAGAGT GGT ACTAC CAGATAGAAATT CT GAAA 84 0 

I | | | | | I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GGAGACAT CT GGTATACCCCTATTAAGGAAGAGT GGTACTACCAGATAGAAATTCT GAAA 933 

T T GGAAATT GGAGGCCAAAGC CT TAAT CT GGACT GCAGAGAGT ATAAC GCAGACAAGGC C 900 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
TT GGAAAT T GGAGGCCAAAGC CT T AAT CT GGACT G C AGAGAGT AT AAC G CAGACAAGGC C 993 

ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I II I I II I 

ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 1053 

GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 102 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I II I I I M I I M I 



CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 108 0 
I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I II II I M M I I II I I I I I I I 

T ACCTGAGAGAC GAGAACT C CAGC AGGT CAT T C C GT AT CACAAT C CT GC CT C AGCT T T AC 1233 

ATT C AGC C CAT GAT GGGGGCCGGC CT GAAT TAT GAAT GT T AC C GAT T C GGC AT TT C C C C A 1200 
I I I M I I M I I I I I I I I M I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I II 



I | | | | | | || | | | | I I I I I I I I I I I I I I I I I I I I II I I I I II I II I M I I I I I I I I M I M 



I | | | | | | | | | | | | | I | I I I I I I I I I I I I II I I I I II II I I I I I I M I I M I I I I I I I I I I 

AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 1413 

GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1380 
| | | | | | | | | | | I I I I I I II I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I M I I 



Qy 



1381 CAGTCTTTGAGCGAGCCCATTTTGTGGATTGTGTCCTATGCGCTCATGAGCGTCTGTGGA 1440 



Db 


1474 


Qy 


1441 


Db 


1534 


Qy 


1501 


Db 


1594 


Qy 


1561 


Db 


1654 


Qy 


1621 


Db 


"ITT A 

1714 


Qy 


1681 


Db 


1774 


Qy 


1741 


Db 


1834 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 

CAGTCTTTGAGCGAGCCCATTTTGTGGATTGTGTCCTATGCGCTCATGAGCGTCTGTGGA 1533 



I | | | | | | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



C GT G ACC CT GAGGT CGT CAAT GAT GAGT C CT CT CT GGT CAGAC AT C G CT G GAAAT GAAT A 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CGT GAC C CT GAGGT CGT CAAT GAT GAGT CCTCTCTGGT CAGACAT C GCT GGAAAT GAAT A 1653 



I I M I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I 



1713 



I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I M I I I I I I I I I I I M I I I I I I I I I I I I I 

AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 1773 

GCTCCCAGATGCCTTCTAGATTCACTGTCTTTTGATTCTTGATTTTCAAGCTTTCAAATC 1740 

I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I 

GCT CCCAGAT GCCTTCTAGAT T CACT GT CT T T T GATT CT T GAT T TT CAAGCT T T CAAAT C 1833 

CTCCCTACTTCCAAGAAAAATAATTAAAAAAAAAACTTCATTCTAA 17 8 6 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

CT CCCT ACTT C CAAGAAAAAT AAT TAAAAAAAAAACT T C ATT CT AA 1879 



RESULT 10 
US-09-978-697-195 
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; Patent No. US20020169284A1 
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Query Match 98.9%; Score 1784.4; DB 9; Length 1879; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 1785; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 

Qy 1 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

| | | | | | | | I I I I I I I | I I I I I I I I I I M I I I i I II I I I I I I I I I I I II I I I I I I I M II I 

D b 94 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 153 

Qy 61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 12 0 

I I I I I M I I I I I I I I I I I I I I I I I I I I I I I M II I I I I I I I I I I I I I I I I I I I I I I I I I I 

D b 154 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 213 

Qy 121 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 180 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I 

D b 214 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 273 

Qy 181 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 240 

I I I I I I M I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 
Db 274 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 333 

Q y 241 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 300 

| | | I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I M II 
Db 334 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 393 

Qy 301 CC C C C GCAGAAGCT AC AGAT T CT C GT T GACACT GGAAGCAGTAACTT T GC CGT GG C AGGA 360 

| | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 394 C C C C CGCAGAAG CT ACAGATT CT C GT T GACACT GGAAGCAGTAACT T T GCCGT GGC AG GA 453 

Q y 361 AC CC CGCACT C CT AC AT AGACAC GT ACT T T GACAC AGAGAG GT CT AG CACAT AC C GCT CC 420 

| | M I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I 
Db 454 AC C CCGCACT C CT AC AT AGACAC GT ACT T T GACACAGAGAGGT CT AGCACAT AC C GCT C C 513 

Qy 421 AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 480 

| | | I M I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I M II I I II I I 
Db 514 AAGGGCT TT GAC GT C AC AGT GAAGT ACACACAAGGAAGCT GGAC G GGCTT C GT T GGGGAA 573 

Qy 4 81 GACCT CGT C AC CAT C C C CAAAGGCT T CAAT ACTT CT T T T CT T GT CAACAT T GC CACT AT T 540 

| | | | | | | | | I I || I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I M I I I I I I I I I I I I 

Db 574 GACCT C GT C AC CAT C C CCAAAGGCT T CAAT ACTT CT T TT CT T GT CAACAT T G C CACT AT T 633 

Qy 541 T T T GAAT CAGAGAAT T T CTT T T T GC CT GGGATT AAAT GGAAT GGAAT ACT T GGC CT AGCT 600 

I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I II I I 
Db 634 T TT GAAT CAGAGAAT TTCTTTTTGCCT GGGATTAAAT GGAAT GGAAT ACT T GGC CT AG CT 693 

Qy 601 TATGCCACACTTGCCAAGCCATCAAGTTCTCTGGAGACCTTCTTCGACTCCCTGGTGACA 660 

| | I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I II II I II I 
Db 694 TATGCCACACTTGCCAAGCCATCAAGTTCTCTGGAGACCTTCTTCGACTCCCTGGTGACA 753 

Qy 661 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 720 

| | | | | | | | | | | | || I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I M I II I I I 

Db 7 54 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 813 

Qy 721 GGATCTGGGACCAACGGAGGTAGTCTTGTCTTGGGTGGAATTGAACCAAGTTTGTATAAA 780 

| | | | | | | | | I I I I I I I I I I I I I I I I I I II I I I II I II I I I I II I I II I I I I I I I I I I I I I 



Db 



814 G GAT CT GG GAC CAACGGAGGT AGT CTT GT CT T GG GT GGAAT T GAAC CAAGT T T GT AT AAA 873 



Qy 


781 


Db 


874 


Qy 


841 


Db 


934 


Qy 


901 


Db 


994 


Qy 


961 


Db 


1054 


Qy 


1021 


Db 


1114 


Qy 


1081 


Db 


1174 


Qy 


1141 


Db 


1234 


Qy 


1201 


Db 


1294 


Qy 


1261 


Db 


1354 


Qy 


1321 


Db 


1414 


Qy 


1381 


Db 


1474 


Qy 


1441 


Db 


1534 


Qy 


1501 


Db 


1594 


Qy 


1561 


Db 


1654 



GGAGACAT CT GGT ATACCCCTATTAAGGAAGAGT GGTACTACCAGAT AGAAATT CT GAAA 8 40 

| | | I | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I M I I I I I M 

GGAGACAT CT GGT ATACCCCTATTAAGGAAGAGT GGTACTACCAGAT AGAAATT CT GAAA 933 

TT GGAAATT GGAGGCCAAAGCCTTAAT CT GGACT GCAGAGAGTATAACGCAGACAAGGCC 900 

I | | | | I I I I I I I I I I I I I I II I I II II I I I I I I I I I I I I I I I I I I I I M I I I I I I I M I I 

T T GGAAAT T GGAGGC CAAAGC CTTAAT CT GGACT G C AGAGAGT AT AAC G C AGACAAGGC C 993 

ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I II I 



GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 102 0 

I | | | | | | | | | | | I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

naanrTnT^nr.rr^r.r;rATr.TrTGATTCCAG7VATTCTCTGATGGTTTCTGGACTGGGTCC 1113 



I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I 
CAGCTGGCGT GCT GG AC GAAT T C GGAAAC ACCT T GGT CT T ACT T C C CT AAAAT CT C CAT C 1173 

TACCTGAGAGATGAGAACT CCAGCAGGTCATT CCGT AT CACAAT CCT GCCT CAGCTTTAC 114 0 
I I I M I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGAC 1353 

AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 1320 
I I I M I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I II II I 



GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1380 

I I I I I I I I I I I M I I II I I I I I I I I I I I I I I I I I I M I I I II I I I I I I I I I I I I I I I I I I 

GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1473 

CAGTCTTTGAGCGAGCCCATTTTGTGGATTGTGTCCTATGCGCTCATGAGCGTCTGTGGA 1440 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

CAGTCTTTGAGCGAGCCCATTTTGTGGATTGTGTCCTATGCGCTCATGAGCGTCTGTGGA 1533 



I || I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I 

GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1593 

CGTGACCCTGAGGTCGTCAATGATGAGTCCTCTCTGGTCAGACATCGCTGGAAATGAATA 1560 

I || | | | | | | | | | I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 

CGTGACCCTGAGGTCGTCAATGATGAGTCCTCTCTGGTCAGACATCGCTGGAAATGAATA 1653 



| | | | | | I I || I I I I I I I I I I II I I I I M I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 



Qy 1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 1680 

I | | | | | | | | M I I I I I I I I I I I M M I I I M I I I I I I I I I I I I I I I I I I I I M I II II I I 

Db 1714 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 1773 

Qy 1681 G CT CCCAG AT GCCTT CT AGAT T CACTGT CT T T T GAT T C T T GAT T T T CAAGCT T T CAAAT C 1740 

I | | | | | | | | | | | | I I I I I I I I I I II I I II M I I I I I I I I I I I I I I I I I I I I I M I I I I I I 

Db 1774 GCTCCCAGATGCCTTCTAGATTCACTGTCTTTTGATTCTTGATTTTCAAGCTTTCAAATC 1833 

Qy 1741 CT CC CTACT T C CAAGAAAAATAATT AAAAAAAAAACTT CAT T CT AA 17 8 6 

II I I I I I I II I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

Db 1834 CT CCCT ACT T C CAAGAAAAATAATT AAAAAAAAAACT T CAT T CT AA 187 9 
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1998-04-29 
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1998-04-29 
NUMBER: 60/083559 

1998-04-29 



PRIOR APPLICATION 
PRIOR FILING DATE: 
PRIOR APPLICATION 
PRIOR FILING DATE: 
PRIOR APPLICATION 
PRIOR FILING DATE: 
PRIOR APPLICATION 
PRIOR FILING DATE: 
PRIOR APPLICATION 
PRIOR FILING DATE: 
PRIOR APPLICATION 
PRIOR FILING DATE: 
PRIOR APPLICATION 
PRIOR FILING DATE: 
PRIOR APPLICATION 
PRIOR FILING DATE: 
PRIOR APPLICATION 
PRIOR FILING DATE: 
PRIOR APPLICATION 
PRIOR FILING DATE: 
PRIOR APPLICATION 
PRIOR FILING DATE: 
PRIOR APPLICATION 
PRIOR FILING DATE: 
PRIOR APPLICATION 
PRIOR FILING DATE: 
PRIOR APPLICATION 
PRIOR FILING DATE: 
PRIOR APPLICATION 
PRIOR FILING DATE: 
PRIOR APPLICATION 
PRIOR FILING DATE: 
PRIOR APPLICATION 
PRIOR FILING DATE: 
PRIOR APPLICATION 
PRIOR FILING DATE: 
PRIOR APPLICATION 
PRIOR FILING DATE: 
PRIOR APPLICATION 
PRIOR FILING DATE: 
PRIOR APPLICATION 
PRIOR FILING DATE: 
PRIOR APPLICATION 
PRIOR FILING DATE: 
PRIOR APPLICATION 



NUMBER: 60/083500 

1998-04-29 
NUMBER: 60/083742 

1998-04-30 
NUMBER: 60/084366 

1998-05-05 
NUMBER: 60/084414 

1998-05-06 
NUMBER: 60/084441 

1998-05-06 
NUMBER: 60/084637 

1998-05-07 
NUMBER: 60/084639 

1998-05-07 
NUMBER: 60/084640 

1998-05-07 
NUMBER: 60/084598 

1998-05-07 
NUMBER: 60/084600 

1998-05-07 
NUMBER: 60/084627 

1998-05-07 
NUMBER: 60/084643 

1998-05-07 
NUMBER: 60/085339 

1998-05-13 
NUMBER: 60/085338 

1998-05-13 
NUMBER: 60/085323 

1998-05-13 
NUMBER: 60/085582 

1998-05-15 
NUMBER: 60/085700 

1998-05-15 
NUMBER: 60/085689 

1998-05-15 
NUMBER: 60/085579 

1998-05-15 
NUMBER: 60/085580 

1998-05-15 
NUMBER: 60/085573 

1998-05-15 
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Query Match 98.9%; Score 1784.4; DB 9; Length 1879; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 1785; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 

Qy 1 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 94 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 153 

Qy 61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 120 

I I | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 154 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 213 



Qy 121 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I M I 

Db 214 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 273 

Qy 181 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 240 

I | | | | | | | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 274 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 333 

Qy 241 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 30 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 334 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 393 

Qy 301 C C C C C G C AGAAGCT AC AGAT T CT C GT T GACACTGGAAGCAGT AACT T T G C C GT GGC AGGA 360 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 394 C C C C C G C AGAAG CT AC AGAT T CT C GT T GACACT GGAAGCAGT AACT T T GC C GT GGC AG GA 453 

Qy 361 AC C C C GC AC T C CT ACAT AGAC AC GT ACT TT GACACAGAGAGGT CT AGCAC AT AC C GCT C C 420 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 454 AC C C C GC AC T C CT AC AT AGAC AC GT ACT TTGACACAGAGAGGT CT AG CACAT AC CGCT C C 513 

Qy 421 AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 48 0 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 514 AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 57 3 

Qy 4 81 GAC CT C GT C AC CAT C C C CAAAGGCT T CAAT ACTT CTT T T CTT GT CAACAT T GC C ACT AT T 54 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I 

Db 574 GAC CT C GT C AC CAT C CC CAAAGGCT T CAAT ACTTCTTT T CT T GT CAACAT T GC C ACT AT T 633 

Qy 541 T T T GAAT C AGAGAAT TTCTTTTTGCCT GGGATT AAAT GGAAT GGAATACT T GGC CT AGCT 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 634 TTTGAATCAGAGAATTTCTTTTTGCCTGGGATTAAATGGAATGGAATACTTGGCCTAGCT 693 

Qy 601 TAT GC CACACT T GC CAAGC CAT CAAGT T CT C T GGAGACCTT CTT C GACT C C CT GGT GAC A 660 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 694 TAT GC CACACT T GC CAAGC CAT CAAGTT CT CT GGAGACCT T CT T C GACT C CCT GGT GAC A 753 

Qy 661 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 72 0 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I M 

Db 754 CAAGCAAACAT C C C CAAC GT T T T CT C CAT GC AGATGT GT GGAGC C GG CT T GC C C GTT GCT 813 

Qy 721 GGAT CT GGGAC CAAC GGAGGTAGT CTTGTCTTGGGT GGAAT TGAAC CAAGTT TGT AT AAA 780 

I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I 

Db 814 GGATCTGGGACCAACGGAGGTAGTCTTGTCTTGGGTGGAATTGAACCAAGTTTGTATAAA 87 3 

Qy 781 GGAGACAT CT G GT AT AC C C CT AT TAAGGAAGAGT GGT ACT AC C AGAT AGAAAT T CT GAAA 84 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 

Db 874 GGAGACAT CT GGT AT AC C C CT AT TAAGGAAGAGT GGT ACT AC C AGAT AGAAAT T CT GAAA 933 

Qy 841 T T GGAAAT T GGAGGC CAAAGC CT T AAT CT GGACT G C AGAGAGT ATAAC GC AGACAAGGC C 900 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I M I I I I I I I I I 

Db 934 T T GGAAATT GGAGG C CAAAGC CT TAAT CT GGACT GCAGAGAGT AT AAC GCAGACAAGGC C 993 

Qy 901 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I 

Db 994 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 1053 



Qy 961 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1020 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 

Db 1054 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1113 

Qy 1021 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 108 0 

II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

Db 1114 CAGCT G GCGT GC T GGAC GAAT T C GGAAACAC CT T G GT CT T AC TT C C CT AAAAT CT C CAT C 1173 

Qy 1081 TACCT GAGAGAT GAGAACT C C AGC AGGT CAT T C C GT AT CACAAT C CT GC CT CAGCT T T AC 114 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I! I I I I I II I I I I I I I I I I I I I M I I I I I 
Db 1174 TACCT GAGAGAC GAGAAC T C CAG C AG GT CATT C C GT AT CACAAT C CT G C CT CAGCT T T AC 12 33 

Qy 1141 ATTCAGCCCATGATGGGGGCCGGCCTGAATTATGAATGTTACCGATTCGGCATTTCCCCA 1200 

I I I I I II II II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I 
Db 1234 ATTCAGCCCATGATGGGGGCCGGCCTGAATTATGAATGTTACCGATTCGGCATTTCCCCA 12 93 

Qy 1201 TCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGAC 12 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I 
Db 1294 TCCACAAAT GC GCT G GT GAT C G GT GC C AC G GT GAT GGAGG G CTT CT AC GT C AT CT T C GAC 1353 

Qy 1261 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 132 0 

I I II I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1354 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 1413 

Qy 1321 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1380 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I M I I I I I I I M I I I 
Db 1414 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 147 3 

Qy 1381 CAGTCTTTGAGCGAGCCCATTTTGTGGATTGTGTCCTATGCGCTCATGAGCGTCTGTGGA 14 4 0 

I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1474 CAGTCTTTGAGCGAGCCCATTTTGTGGATTGTGTCCTATGCGCTCATGAGCGTCTGTGGA 1533 

Qy 1441 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1534 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1593 

Qy 1501 CGTGACCCTGAGGTCGTCAATGATGAGTCCTCTCTGGTCAGACATCGCTGGAAATGAATA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1594 CGTGACCCTGAGGTCGTCAATGATGAGTCCTCTCTGGTCAGACATCGCTGGAAATGAATA 1653 

Qy 1561 GCCAGGCCTGACCTCAAGCAACCATGAACTCAGCTATTAAGAAAATCACATTTCCAGGGC 1620 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

Db 1654 GCCAGGCCTGACCTCAAGCAACCATGAACTCAGCTATTAAGAAAATCACATTTCCAGGGC 1713 

Qy 1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 1680 

II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I 

Db 1714 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 1773 

Qy 1681 GCTCCCAGATGCCTTCTAGATTCACTGTCTTTTGATTCTTGATTTTCAAGCTTTCAAATC 1740 

I I I I I I I I I I I I I I I I I I I I II I I I II I I I M II I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 1774 GCTCCCAGATGCCTTCTAGATTCACTGTCTTTTGATTCTTGATTTTCAAGCTTTCAAATC 1833 

Qy 1741 CTCCCTACTTCCAAGAAAAATAATTAAAAAAAAAACTTCATTCTAA 17 8 6 

I I I I I I I I II I I I I I II II I I I I I I I I I II I I I I I I I I I I I I II I I 
Db 1834 CTCCCTACTTCCAAGAAAAATAATTAAAAAAAAAACTTCATTCTAA 187 9 



r 
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Sequence 195, Application US/09999832A 
Publication No. US20020192706A1 
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APPLICANT 
APPLICANT 
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PRIOR FILING DATE 
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PRIOR FILING DATE 
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PRIOR FILING DATE 
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PRIOR APPLICATION 
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PRIOR FILING DATE 
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PRIOR FILING DATE: 1998-04-29 
PRIOR APPLICATION NUMBER: 60/083554 
PRIOR FILING DATE: 1998-04-29 
PRIOR APPLICATION NUMBER: 60/083558 
PRIOR FILING DATE: 1998-04-29 
PRIOR APPLICATION NUMBER: 60/083559 
PRIOR FILING DATE: 1998-04-29 
PRIOR APPLICATION NUMBER: 60/083500 
PRIOR FILING DATE: 1998-04-29 
PRIOR APPLICATION NUMBER: 60/083742 
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PRIOR APPLICATION NUMBER: 60/084366 
PRIOR FILING DATE: 1998-05-05 
PRIOR APPLICATION NUMBER: 60/084414 
PRIOR FILING DATE: 1998-05-06 
PRIOR APPLICATION NUMBER: 60/084441 
PRIOR FILING DATE: 1998-05-06 
PRIOR APPLICATION NUMBER: 60/084637 
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PRIOR APPLICATION NUMBER: 60/084639 
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PRIOR APPLICATION NUMBER: 60/084640 
PRIOR FILING DATE: 1998-05-07 
PRIOR APPLICATION NUMBER : 60/084598 
PRIOR FILING DATE: 1998-05-07 
PRIOR APPLICATION NUMBER: 60/084600 
PRIOR FILING DATE: 1998-05-07 
PRIOR APPLICATION NUMBER: 60/084627 
PRIOR FILING DATE: 1998-05-07 
PRIOR APPLICATION NUMBER: 60/084643 
PRIOR FILING DATE: 1998-05-07 
PRIOR APPLICATION NUMBER: 60/085339 
PRIOR FILING DATE: 1998-05-13 
PRIOR APPLICATION NUMBER: 60/085338 
PRIOR FILING DATE: 1998-05-13 
PRIOR APPLICATION NUMBER: 60/085323 
PRIOR FILING DATE: 1998-05-13 
PRIOR APPLICATION NUMBER: 60/085582 
PRIOR FILING DATE: 1998-05-15 
PRIOR APPLICATION NUMBER: 60/085700 
PRIOR FILING DATE: 1998-05-15 
PRIOR APPLICATION NUMBER: 60/085689 
PRIOR FILING DATE: 1998-05-15 
PRIOR APPLICATION NUMBER: 60/085579 
PRIOR FILING DATE: 1998-05-15 
PRIOR APPLICATION NUMBER: 60/085580 
PRIOR FILING DATE: 1998-05-15 
PRIOR APPLICATION NUMBER: 60/085573 
PRIOR FILING DATE: 1998-05-15 
PRIOR APPLICATION NUMBER: 60/085704 
PRIOR FILING DATE: 1998-05-15 
PRIOR APPLICATION NUMBER: 60/085697 

Query Match 98.9%; Score 1784.4; DB 9; Length 1879; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 1785; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 

Qy 1 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I > I I I I I I I 

Db 94 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 153 

Qy 61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 12 0 

I I I I I I I I I I I I I I I II I I I I I II I I I I I I I M I I I I I I I I I I I I I I I I I I I M I I I I I I 

Db 154 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 213 

Qy 121 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 180 

I | | I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M M I I I I I II I I 

Db 214 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 273 

Qy 181 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 

Db 274 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 333 

Qy 241 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 300 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I 

Db 334 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 393 



301 C C C C C GCAGAAGCT AC AGAT T CT C GTT GACACT GGAAGCAGT AACT T T GCC GT GGCAGGA 360 



Db 


394 


Qy 


361 


Db 


454 


Qy 


421 


Db 


514 


Qy 


481 


Db 


574 


Qy 


541 


Db 


634 


Qy 


601 


Db 


694 


Qy 


661 


Db 


754 


Qy 


721 


Db 


814 


Qy 


781 


Db 


874 


Qy 


841 


Db 


934 


Qy 


901 


Db 


994 


Qy 


961 


Db 


1054 


Ov 


1021 


Db 


1114 


Qy 


1081 


Db 


1174 


Qy 


1141 



I I I I I M I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I M I M I 

C C C C C GC AGAAGCT AC AGATT CT CGT T GACACT GGAAG C AGTAACT TT G C C GT G GC AGGA 453 

ACC C C GCACT C CT AC ATAGAC ACGT ACT T T GAC ACAGAGAGGT CT AGCACAT AC C GCT C C 420 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
AC C C CG C ACT C CT AC AT AGAC AC GT ACT T T GACACAGAGAGGT CT AGCACAT AC CG CT C C 513 

AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 480 

I | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I M I I I I I I I I I I I I I I I I II 

AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 573 

GAC CT C GT C AC CAT C C C CAAAGGCTT CAAT ACT T CTTTTCTTGT CAACAT T G C CACT AT T 540 

M I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

GACCTCGTCACCATCCCCAAAGGCTTCAATACTTCTTTTCTTGTCAACATTGCCACTATT 633 

T TT GAAT C AGAGAAT T T CT T T T T GCCT GGGAT T AAAT GGAAT G GAAT AC T T GGC CT AGCT 600 
I I I I I I I I I I I I I I I I I! I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I 
T T T GAAT CAGAGAAT TTCTTTTT GCCT GGGAT TAAAT G GAAT GGAAT ACT T G GC CT AGCT 693 

TAT GC C ACACT T GC CAAG C CAT CAAGTT CT CT GGAGAC CT T CT T C GACT CC CT GGT GAC A 660 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I 
TAT GC C AC ACTT GC CAAGC C AT CAAGTTCT CT G GAGAC CT T CT T C GACT C C C T GGT GAC A 753 

CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 720 

I | | | | | I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 813 

G GAT CT GGGAC CAAC GGAG GT AGT CTT GT CTT GGGT GGAAT T GAAC CAAGT T T GT AT AAA 7 80 

I | | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I M I I I I M M I I I 

GGATCTGGGACCAACGGAGGTAGTCTTGTCTTGGGTGGAATTGAACCAAGTTTGTATAAA 873 

GGAGAC AT CT GGT AT AC C C CT AT TAAGGAAGAGT GGT AC T AC CAGAT AGAAAT T CT GAAA 840 

I | I I I M I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I II I I I I I I I I 

GGAGAC AT CT GGT AT AC C C CT AT T AAG GAAGAGT GGT ACT AC CAGAT AGAAAT T CT GAAA 933 

T T GGAAAT T GGAGGC CAAAGC CT TAAT CT GGACT GCAGAGAGT AT AAC GC AGACAAGGC C 900 
I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I II I I 
T T GGAAAT T GGAGGC CAAAGC CTT AAT CT GGACT GCAGAGAGT AT AAC GCAGACAAGGC C 993 

ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 

I M || | | | | | I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I M I I I I I I 

ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 1053 

GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1020 

I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1113 



I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I II I I 



M I I I I I I I I I I I I I I I I I I I I M I I I I M I I I I II I I I I I I I I II I I I I I I I I I I I I I 



| | | | | | | || | | | | I I I I I I I I II I I I I I I I I I I I I I PI I I I I I I I I I I I I I I I I I I I 



Db 



1234 ATT CAGC C CAT GAT GGGGGCCGGCCT GAAT TAT GAAT GTT AC C GAT T C G GC ATT T C C C C A 



1293 



Qy 1201 T CCACAAAT G C G CT GGT GAT C G GT GC C AC GGT GAT GGAGGGCT T CT AC GT CAT CT T C GAC 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1294 T CCACAAAT G C G CT GGT GAT C G GT GC C AC GGT GAT GGAGGGCT T CT AC GT CAT CT T C GAC 1353 

Qy 1261 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 1320 

I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1354 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 1413 

Qy 1321 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1380 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I 
Db 1414 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1473 

Qy 1381 CAGT CT T T GAGC GAG C C CAT T T T GT GGAT T GT GT C CT AT GC GC T CAT GAGC GT CT GT GGA 144 0 

I I I I I I II I I I I II I I I I I I I I I I I I I I I I II I I I I M I II I II II I I II I I I I I I I I I I 
Db 1474 CAGT CT T T GAGC GAG C C CAT T T T GT GGAT T GT GT CCT AT GC GC T CAT GAGC GT CT GT GGA 1533 

Qy 1441 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I 
Db 1534 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1593 

Qy 1501 CGT GAC C CT GAG GT C GT CAAT GAT GAGT CCT CT CT GGT CAGAC AT C GCT GGAAAT GAAT A 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 

Db 1594 CGT GAC C CT GAGGT C GT CAAT GAT GAGT C CT CT CT GGT CAGAC AT C GCT GGAAAT GAAT A 1653 

Qy 1561 GCCAGG C CT GAC CT CAAGCAAC CAT GAACT CAGCT ATT AAGAAAAT CAC AT TT C C AG GGC 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1654 GCCAGG C CT GAC CT CAAG CAAC CAT GAACT CAGCT ATT AAGAAAAT CAC AT TT C C AGGGC 1713 

Qy 1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 168 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1714 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 1773 

Qy 1681 GCT C C C AGAT GC CT T CT AGAT T CACT GT CTT TT GATT CT T GAT T T T CAAG C TT T CAAAT C 174 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I M I 
Db 1774 GCT C C CAGAT GC CT T CT AGAT T CACT GT CTT TT GATT CT T GAT T T T CAAGCT T T CAAAT C 1833 

Qy 1741 CTC C CT ACT T C CAAGAAAAAT AAT T AAAAAAAAAACTT C AT T CT AA 17 8 6 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1834 CTC C CT ACT T C CAAGAAAAAT AAT T AAAAAAAAAACTT CAT T CT AA 187 9 
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Query Match 98.9%; Score 1784.4; DB 10; Length 1879; 
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Qy 1 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I 

Db 94 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 153 

Qy 61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 120 

I I I I I I I I I I I I I I I I I II I I II I I I II M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 154 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 213 

Qy 121 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 18 0 

I I 1 M I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 214 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 273 

Qy 181 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 240 

I | I I I I I I I I I I M I I I I I I I I I II I I I I I I I I II II I I I I I I II I I I I I I I I I I I I I I I 

Db 274 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 333 

Qy 241 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 300 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I II I I I I I I I I I 
Db 334 GTAGACAAC CT GCAGGGGGACT CT GGC C G C GGCT ACT AC CT GGAGAT GCT GAT C GG GAC C 393 

Qy 301 C C C C C GCAGAAGCT ACAGAT T CT C GT T GAC ACT GGAAGCAGTAACT TT GC C GT GGC AGGA 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 394 CCCCCGCAGAAGCTACAGATTCTCGTTGACACTGGAAGCAGTAACTTTGCCGTGGCAGGA 453 

Qy 361 AC C C C GCACT C CT ACAT AGACAC GT ACT T T GACAC AGAGAGGT CT AGCAC AT AC C GCT C C 42 0 

I | M | | I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I M I I I I I I 

Db 4 54 AC C C C GCACT CCTACAT AGACAC GT ACT T T GACAC AGAGAGGT CTAGCACAT AC C G CT C C 513 

Qy 421 AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 480 

I | M | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I M I I I I 
Db 514 AAGG GCTT T GACGT CAC AGT GAAGT AC AC ACAAGGAAGCT GGACGGG CT T C GT T G GG GAA 573 



QY 
Db 



481 
574 



540 
633 



Qy 541 TTTGAATCAGAGAATTTCTTTTTGCCTGGGATTAAATGGAATGGAATACTTGGCCTAGCT 600 

I M I I I I I I M M I I I I I I I II II I M I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I 

Db 634 TTTGAATCAGAGAATTTCTTTTTGCCTGGGATTAAATGGAATGGAATACTTGGCCTAGCT 693 

Qy 601 TAT G C C AC ACT T G C CAAGCCAT CAAGTT CT CT GGAGACCT TCT T C GAC T C C CT GGT GAC A 660 

I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I 
Db 694 T AT GC CAC ACT T GC CAAGCCAT CAAGTT CT CT GGAGACCT T CTT C GACT C C CT GGT GAC A 753 

Qy 661 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 72 0 

I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 754 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 813 

Qy 721 GGAT CT GGGAC CAAC GGAGGTAGT CTT GT CTT GGGT GGAATT GAAC CAAGT T T GTAT AAA 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 814 GGATCTGGGACCAACGGAGGTAGTCTTGTCTTGGGTGGAATTGAACCAAGTTTGTATAAA 873 

Qy 781 GGAGAC AT CT GGT AT AC C C CT ATTAAGGAAGAGT GGT ACT ACCAGAT AGAAAT TCT GAAA 840 

I I I I M I M I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 874 G G AGAC AT C T G GTAT AC C C C T ATT AAG GAAG AGT G GT ACT AC CAGAT AGAAAT TCT GAAA 933 

Qy 841 TT GGAAAT T GGAGGC CAAAGC CTT AAT CT GGACT GCAGAGAGTAT AACGCAGACAAGGC C 900 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 934 T T GGAAAT T GGAGGC CAAAGC CTT AAT CT GGACT GCAGAGAGTAT AAC GCAGACAAGGCC 993 

Qy 901 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 9 94 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 1053 

Qy 961 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1020 

I I I I I M I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1054 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1113 

Qy 1021 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I M I I I 
Db 1114 C AGCT GG C GT GCT GGAC GAAT T C GGAAACAC C T T G GT CT T ACTT C CCT AAAAT CTCCAT C 1173 

Qy 1081 T AC CT GAGAGAT GAGAACT C C AGCAG GT CAT T CC GT AT C ACAAT C CT GC CT CAGCTTTAC 1140 

I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 

Db 1174 T AC CT GAGAGAC GAGAACT C C AGC AGGT C ATT C C GTAT C ACAAT C CT GC CT CAGCTTTAC 1233 

Qy H41 ATTCAGCCCATGATGGGGGCCGGCCTGAATTATGT^ATGTTACCGATTCGGCATTTCCCCA 1200 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

Db 1234 AT T CAGC C CAT GAT GGGGGCCGGCCT GAAT TAT GAAT GT T AC C GAT T C GGCAT T T C CC C A 1293 

Qy 1201 TCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGAC 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 12 94 TCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGAC 1353 

Qy 1261 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1354 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 1413 

Qy 1321 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1414 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1473 



Qy 1381 CAGTCTTTGAGCGAGCCCATTTTGTGGATTGTGTCCTATGCGCTCATGAGCGTCTGTGGA 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 
Db 1474 CAGT CT T T GAG C GAGC C CAT T T T GT GGATT GT GT C CT AT GC GCT CAT GAGC GT CT GT GGA 1533 

Qy 1441 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 

I | | | | | | | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I M M I I I I 

Db 1534 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1593 

Qy 1501 C GT GAC C CT GAGGT C GT CAAT GAT GAGT CCT CTCT GGT CAGAC AT C GCT G GAAAT GAAT A 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I 

Db 1594 C GT GAC C CT GAGGT C GT CAAT GAT GAGT CCT CTCT G GT CAGAC AT C GCT GGAAAT GAAT A 1653 

Qy 1561 GC C AGGC CT GAC CT CAAGCAAC CAT GAACTCAGCT AT TAAGAAAAT C AC AT T T C CAG GGC 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1654 GC C AGGC CT GAC CT CAAGCAAC CAT GAACTCAGCT AT TAAGAAAAT CAC AT T T C CAGGGC 1713 

Qy 1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 1680 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I 

Db 1714 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 1773 

Qy 1681 GCT C C CAGAT G C CT T CT AGAT T C ACT GT CTTTT GAT T CT T GAT T T T CAAGCT T T CAAAT C 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1774 GCT C C CAGAT GC CT T CT AGAT T C ACT GT CTTTTGAT T CT T GAT T T T CAAGCTT T CAAAT C 1833 

Qy 1741 CT C C CT ACT T C CAAGAAAAAT AAT TAAAAAAAAAACT T CAT T CTAA 1786 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

Db 1834 CTCCCTACTTCCAAGAAAAATAATTAAAAAAAAAACTTCATTCTAA 1879 



RESULT 14 

US-09-978-608A-195 

; Sequence 195, Application US/09978608A 
; Publication No. US20030045462A1 
; GENERAL INFORMATION : 



APPLICANT: 


Ashkenazi, Avi 


APPLICANT: 


Baker Kevin P. 


APPLICANT: 


Botstein, David 


APPLICANT: 


Desnoyers, Luc 


APPLICANT: 


Eaton, Dan 


APPLICANT: 


Ferrara, Napoleon 


APPLICANT: 


Filvaroff, Ellen 


APPLICANT : 


: Fong, Sherman 


APPLICANT: 


: Gao, Wei-Qiang 


APPLICANT: 


: Gerber, Hanspeter 


APPLICANT: 


: Gerritsen, Mary E. 


APPLICANT: 


: Goddard, Audrey 


APPLICANT: 


; Godowski, Paul J. 


APPLICANT: 


: Grimaldi, J. Christopher 


APPLICANT: 


: Gurney, Austin L. 


APPLICANT: 


: Hillan, Kenneth J 


APPLICANT: 


: Kljavin, Ivar J. 


APPLICANT: 


: Kuo, Sophia S. 


APPLICANT: 


: Napier, Mary A. 


APPLICANT: 


: Pan, James; 


APPLICANT 


: Paoni, Nicholas F. 


APPLICANT 


: Roy, Margaret Ann 


APPLICANT 


: Shelton, David L. 



APPLICANT: Stewart, Timothy A. 
APPLICANT : Tumas, Daniel 
APPLICANT: Williams, P. Mickey 
APPLICANT: Wood, William I. 

TITLE OF INVENTION: Secreted and Transmembrane Polypeptides and Nucleic 
TITLE OF INVENTION: Acids Encoding the Same 
FILE REFERENCE: P2630P1C22 

CURRENT APPLICATION NUMBER: US/09/978 , 608A 
CURRENT FILING DATE: 2001-10-16 
NUMBER OF SEQ ID NOS : 62 4 
Prior Application removed - See File Wrapper or Palm 
SEQ ID NO 195 
LENGTH: 187 9 
TYPE : DNA 

ORGANISM: Homo sapien 
US-09-978-608A-195 



Query Match 98.9%; Score 1784.4; DB 10; Length 1879; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 1785; Conservative 0; Mismatches 1; Indels 0; Gaps 



0; 



Qy 

Db 



1 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I 

94 ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 153 



Qy 

Db 



61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 120 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

154 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 213 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



121 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 180 

I I I hi I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

214 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 273 

181 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 240 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 

274 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 333 

241 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I M I I 

334 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 393 

301 C C C C C G CAGAAGCT AC AGAT T CT C GT T GAC ACT GGAAGCAGTAACTTT GC C GT GGCAGGA 360 

I M I I I I I I I II M I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

394 CCCCCGCAGAAGCTACAGATTCTCGTTGACACTGGAAGCAGTAACTTTGCCGTGGCAGGA 453 

361 AC C C C GCACT C CT ACAT AGACAC GT ACTT T GACAC AGAGAGGT CTAGC ACAT AC C GCT CC 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

454 AC C C C GCACT C CT ACAT AGACAC GT ACT T T GACAC AGAGAG GT CTAGC ACAT AC C GCT CC 513 



Qy 

Db 

Qy 

Db 



421 AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 480 

I I M | I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I 

514 AAGGGCTTTGACGTCACAGTGAAGTACACACAAGGAAGCTGGACGGGCTTCGTTGGGGAA 573 

481 GACCTCGTCACCATCCCCAAAGGCTTCAATACTTCTTTTCTTGTCAACATTGCCACTATT 540 

I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

574 GACCTCGTCAC CAT CCCCAAAGGCTTCAAT ACTT CTTTTCTTGTCAACATTGCCACTATT 633 



Qy 


541 


Db 


634 


Qy 


601 


Db 


694 


Qy 


661 


Db 


754 


Qy 


721 


Db 


814 


Qy 


781 


Db 


874 


Qy 


841 


Db 


934 


Qy 


901 


Db 


994 


Qy 


961 


Db 


1054 


Qy 


1021 


Db 


1114 


Qy 


1081 


Db 


1174 


Qy 


1141 


Db 


1234 


Qy 


1201 


Db 


1294 


Qy 


1261 


Db 


1354 


Qy 


1321 


Db 


1414 



TTTGAATCAGAGAATTTCTTTTTGCCTGGGATTAAATGGAATGGAATACTTGGCCTAGCT 600 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

TTT GAAT CAGAGAATTTCTTTTT GCCTGGGATTAAATGGAAT GGAAT ACTT GGCCTAGCT 693 

TAT GC C ACACT T GC CAAGC CAT CAAGTTCTCT GGAGAC CT T CT T C GACT C C CT G GT GACA 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I 

TAT GC CACACT T G C CAAG C CAT CAAGTTCT CT GGAGACCT T CT T CGACT C C CT GGT GACA 753 

CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 720 
I | | | | I || I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I II I I I I I I I I I I I 



GGAT CT GG GAC CAAC GGAGGT AGT CT TGT CTT GGGT GGAATT GAAC CAAGT TT GT AT AAA 780 

I I I I I I I I II I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I M I I I II I I I I I 

GGATCTGGGACCAACGGAGGTAGTCTTGTCTTGGGTGGAATTGAACCAAGTTTGTATAAA 87 3 

GGAGACAT CT GGT AT ACCCCTATTAAGGAAGAGTGGTACTACCAGATAGAAATT CT GAAA 840 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I 

GGAGACAT CT GGTATACCCCTATTAAGGAAGAGTGGTACTACCAGAT AGAAATT CTGAAA 933 
TT GGAAAT T G GAGGC CAAAGC CTTAAT CT GGACT GCAGAGAGT AT AACGC AGACAAGGC C 900 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I M I I I I I I I I I I I I I I I 

T T G GAAAT T GGAGGC CAAAGC CT TAAT CT GGACT GCAGAGAGT AT AACGC AGACAAGGC C 993 

ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 
I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I M I I I I I I I I I I I 



GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1020 

I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I II 

GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1113 

CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 108 0 
I | | | | | | I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I II I I I I I I I I I 



I | || | | | | | I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I M I I I I I I I I I 

ATTCAGCCCATGATGGGGGCCGGCCTGAATTATGAATGTTACCGATTCGGCATTTCCCCA 1293 



I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGAC 1353 



I I I I I I I I M II I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I 

AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 1413 



| M | I II I I I I I I I M II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 



Qy 



1381 CAGTCTTTGAGCGAGCCCATTTTGTGGATTGTGTCCTATGCGCTCATGAGCGTCTGTGGA 1440 



Db 



1474 



1533 



Qy 1441 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 1534 GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1593 

Qy 1501 C GT GACC CT GAGGT C GT CAAT GAT GAGT CCTCTCTGGT C AGAC AT C G CT G GAAAT GAAT A 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I 
Db 1594 C GT GACCCT GAGGTC GT CAAT GAT GAGT CCTCTCTGGT C AGAC AT C GCT G GAAAT GAAT A 1653 

Qy 1561 GC C AGGCCT GAC CT CAAG CAAC CAT GAACT CAGCT AT TAAGAAAAT CACAT T T C C AGG GC 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1654 GC C AG GCCT GACCT CAAG CAAC CAT GAACT CAGCT AT TAAGAAAAT CACAT T T C C AGGGC 1713 

Qy 1621 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 1680 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1714 AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 1773 

Qy 1681 GCT C C CAGAT GC CTT CT AGATT CACT GT CT T T T GAT T CT T GAT T TT CAAGCT T T CAAAT C 17 40 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1774 GCT C C CAGAT GC CTT CT AGAT T CACT GT CT T T T GAT T CT T GAT T TT CAAGCT T T CAAAT C 1833 

Qy 1741 CT C C CTACT T CCAAGAAAAATAAT TAAAAAAAAAACT T CAT T CT AA 17 8 6 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1834 CT C C CTACT T CCAAGAAAAATAAT TAAAAAAAAAACT T CAT T CT AA 1879 



RESULT 15 

US-09-978-585A-195 

; Sequence 195, Application US/09978585A 
; Publication No. US20030049633A1 
; GENERAL INFORMATION: 



APPLICANT: 


Ashkenazi, Avi 


APPLICANT: 


Baker Kevin P. 


APPLICANT: 


Botstein, David 


APPLICANT: 


Desnoyers, Luc 


APPLICANT: 


Eaton, Dan 


APPLICANT: 


Ferrara, Napoleon 


APPLICANT: 


Filvaroff, Ellen 


APPLICANT: 


; Fong, Sherman 


APPLICANT: 


: Gao, Wei-Qiang 


APPLICANT: 


: Gerber, Hanspeter 


APPLICANT: 


: Gerritsen, Mary E. 


APPLICANT: 


; Goddard, Audrey 


APPLICANT: 


: Godowski, Paul J. 


APPLICANT: 


: Grimaldi, J. Christopher 


APPLICANT: 


: Gurney, Austin L. 


APPLICANT: 


: Hillan, Kenneth J 


APPLICANT: 


: Kljavin, Ivar J. 


APPLICANT: 


: Kuo, Sophia S. 


APPLICANT: 


: Napier, Mary A. 


APPLICANT: 


: Pan, James; 


APPLICANT: 


: Paoni, Nicholas F. 


APPLICANT; 


: Roy, Margaret^ Ann 


APPLICANT: 


: Shelton, David L. 


APPLICANT: 


: Stewart, Timothy A. 



APPLICANT 
APPLICANT 
APPLICANT 
TITLE OF 



Tumas, Daniel 
Williams, P. Mickey 
Wood, William I. 
INVENTION: Secreted and Transmembrane Polypeptides and Nucleic 



TITLE OF INVENTION: Acids Encoding the Same 
FILE REFERENCE: P2630P1C15 

CURRENT APPLICATION NUMBER: US/09/978 , 585A 
CURRENT FILING DATE: 2001-10-16 
NUMBER OF SEQ ID NOS : 624 
Prior Application removed - See File Wrapper or Palm 
SEQ ID NO 195 
LENGTH: 1879 
TYPE: DNA 

ORGANISM: Homo sapien 
US-09-978-585A-195 



Query Match 98.9%; Score 1784.4; 

Best Local Similarity 99.9%; Pred. No. 0; 
Matches 1785; Conservative 0; Mismatches 



DB 10; Length 1879; 



1; Indels 



0; Gaps 



0; 



Qy 

Db 



94 



ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 60 

I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

ATGGGCGCACTGGCCCGGGCGCTGCTGCTGCCTCTGCTGGCCCAGTGGCTCCTGCGCGCC 153 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



61 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I M I I I I I I I I I I I I I I 

154 GCCCCGGAGCTGGCCCCCGCGCCCTTCACGCTGCCCCTCCGGGTGGCCGCGGCCACGAAC 213 

12 1 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

214 CGCGTAGTTGCGCCCACCCCGGGACCCGGGACCCCTGCCGAGCGCCACGCCGACGGCTTG 273 



181 



301 



361 



481 



240 



GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 

I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

27 4 GCGCTCGCCCTGGAGCCTGCCCTGGCGTCCCCCGCGGGCGCCGCCAACTTCTTGGCCATG 333 

241 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I M I I 

334 GTAGACAACCTGCAGGGGGACTCTGGCCGCGGCTACTACCTGGAGATGCTGATCGGGACC 393 



360 



C C C C CGCAGAAGCT AC AGATT CT C GT T GAC AC T GGAAGCAGT AACT T T GCCGT GGC AG GA 

I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

394 C C C C CGCAGAAGCT AC AGATT CT C GT T GAC ACT GGAAGCAGT AACT T T GC CGT GGCAGGA 453 



420 



ACC CCGCACT CCTACATAGACACGT ACTTT GACACAGAGAGGT CTAGCACATACCGCT CC 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

454 ACCCCGCACT CCTACATAGACACGT ACTTT GACACAGAGAGGT CT AGCACATACCGCT CC 513 

421 AAGGGCT T T GAC GT C ACAGTGAAGT AC AC ACAAGGAAGCT GGAC G GG CTT C GT T GG GGAA 480 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I 
514 AAG GGCT T T GAC GT C AC AGT GAAGT ACACACAAGGAAGCT GGAC GGGCTT C GT T GGGGAA 573 



540 



GAC CT C GT C AC CAT C C C CAAAGG C T T CAAT ACT T CT TTT CT T GT CAACATT G C C ACT AT T 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I 

574 GACCTCGTCACCATCCCCA7\AGGCTTCAATACTTCTTTTCTTGTCAACATTGCCACTATT 633 

541 TTTGAATCAGAGAATTTCTTTTTGCCTGGGATTAAATGGAATGGAATACTTGGCCTAGCT 600 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I i I 

Db 634 TTTGAATCAGAGAATTTCTTTTTGCCTGGGATTAAATGGAATGGAATACTTGGCCTAGCT 693 

Qy 601 TAT G C CAC AC T T GCCAAGCCAT CAAGTT CT CT G GAGAC CT T CT T C GACT C C CT G GT GAC A 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I 

Db 694 TAT GC C ACACT TGCCAAGCCAT CAAGTT CT CT GGAGAC CT T CT T C GACT C C CT GGT GAC A 753 

Qy 661 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 720 

I I I M I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I M 

Db 754 CAAGCAAACATCCCCAACGTTTTCTCCATGCAGATGTGTGGAGCCGGCTTGCCCGTTGCT 813 

Qy 721 GGATCTGGGACCAACGGAGGTAGTCTTGTCTTGGGTGGAATTGAACCAAGTTTGTATAAA 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 

Db 814 GGAT CT GGGACCAACGGAGGTAGTCTTGT CTT GGGT GGAATT GAACCAAGTTT GTATAAA 873 

Qy 781 GGAGACATCTGGTATACCCCTATTAAGGAAGAGTGGTACTACCAGATAGAAATTCTGAAA 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I M 

Db 874 GGAGACATCTGGTATACCCCTATTAAGGAAGAGTGGTACTACCAGATAGAAATTCTGAAA 933 

Qy 841 TT GGAAATTGGAGGCCAAAGCCTTAAT CT GGACT GCAGAGAGT ATAACGCAGACAAGGCC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I N N II I I I 
Db 934 T T GGAAATTGGAG GC CAAAGC CT T AAT CT G GACT GCAGAGAGT AT AAC GCAGACAAGGC C 993 

Qy 901 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 960 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I 

Db 994 ATCGTGGACAGTGGCACCACGCTGCTGCGCCTGCCCCAGAAGGTGTTTGATGCGGTGGTG 1053 

Qy 961 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 102 0 

I | | | | | | I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 
Db 1054 GAAGCTGTGGCCCGCGCATCTCTGATTCCAGAATTCTCTGATGGTTTCTGGACTGGGTCC 1113 

Qy 1021 CAGCTGGCGTGCTGGACGAATTCGGAAACACCTTGGTCTTACTTCCCTAAAATCTCCATC 108 0 

I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1114 CAGCTGGCGTGCTGGACGAATTCGGA7^ACACCTTGGTCTTACTTCCCTA7W^TCTCCATC 1173 

Qy 1081 TAC CT GAGAGAT GAGAACT C C AGCAGGT CAT T C C GT AT CACAAT C CT GC CT CAGCT T T AC 114 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1174 T ACCT GAGAGAC GAGAACT CCAGCAGGT CATT C C GT AT CACAAT C CT GC CT CAGCT T TAC 1233 

Qy H41 ATTCAGC C CAT GAT GGGGGC C GGC CT GAAT TAT GAAT GTT AC C GAT T C GGC AT T T C C C C A 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1234 ATT C AGC C CAT GAT GGGGGCCGGCCT GAATT AT GAAT GT T ACC GAT T C GGCAT T T C C C C A 12 93 

Qy 1201 TCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGAC 1260 

I | | I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 1294 TCCACAAATGCGCTGGTGATCGGTGCCACGGTGATGGAGGGCTTCTACGTCATCTTCGAC 1353 

Qy 1261 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1354 AGAGCCCAGAAGAGGGTGGGCTTCGCAGCGAGCCCCTGTGCAGAAATTGCAGGTGCTGCA 1413 

Qy 1321 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1380 

| | M II I I I I I I I I I I I I I I I I I M I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1414 GTGTCTGAAATTTCCGGGCCTTTCTCAACAGAGGATGTAGCCAGCAACTGTGTCCCCGCT 1473 

Qy 1381 CAGTCTTTGAGCGAGCCCATTTTGTGGATTGTGTCCTATGCGCTCATGAGCGTCTGTGGA 1440 

| | | | | | | | || | | | | II II I I I I I I II I I I I I I I I I I I I I I I I I I I I I M I M I I I I I I I I 



Db 


1474 


Qy 


1441 


Db 


1534 


Qy 


1501 


Db 


1594 


Qy 


1561 


Db 


1654 


Qy 


1621 


Db 


1714 


Qy 


1681 


Db 


1774 


Qy 


1741 


Db 


1834 



1474 CAGT CT TT GAGCGAGC C CAT T T T GT GGAT T GT GT C CT AT GC GCT CAT GAGC GT CT GT GGA 1533 

GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1500 

I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I M I I I I 

GCCATCCTCCTTGTCTTAATCGTCCTGCTGCTGCTGCCGTTCCGGTGTCAGCGTCGCCCC 1593 

C GT GAC C CT GAGGT C GT CAAT GAT GAGT CCTCTCTGGT CAGACAT C GCT GGAAAT GAAT A 1560 

I | | I I I I I I I I II I I I I I I I I I II I I I I I I I I I M I I II I I I I I I I I I I I I I I I I I I I I I 

CGT GACCCT GAGGT CGT CAAT GAT GAGT CCT CT CT GGT CAGACAT CGCT GGAAAT GAAT A 1653 



| || | | || I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I 



AGCAGCCGGGATCGATGGTGGCGCTTTCTCCTGTGCCCACCCGTCTTCAATCTCTGTTCT 168 0 
M | I I I I I I I I M I I I I M I I I I I I I I I I I I I I I I I I I M I I I I I I I I M I I I II I I I I I 



I I M | I I I I I I M I I I I I I I I I I I I I I I I I II I I I I I I II I I I I II I I I I I I I I I I I I I I 



CTCCCTACTTCCAAGAAAAATAATTAAAAAAAAAACTTCATTCTAA 17 86 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 
CTCCCTACTTCCAAGAAAAATAATTAAAAAAAAAACTTCATTCTAA 18 79 



Search completed: February 28, 2004, 08:48:42 
Job time : 645 sees 



